OpenRouter라는 플랫폼은 GPT, Claude, Gemini를 비롯해 200개가 넘는 AI 모델을 골라 쓸 수 있는 통합 API 서비스입니다. 개발자와 스타트업이 AI 앱을 만들 때 이 모델들을 연결해주는 허브 역할을 하죠.
이 허브에는 재밌는 게 하나 있습니다. 어떤 서비스가 토큰을 가장 많이 쓰는지 보여주는 일간 랭킹으로, 전 세계 AI 앱과 에이전트의 실사용량 순위표라고 보시면 됩니다. 올해 들어서는 에이전트 서비스 Openclaw가 굳건한 1위를 차지하고 있었는데요, 5월 10일 그 순위가 바뀌었습니다.
새로 왕좌를 차지한 건, AI 에이전트 서비스 Hermes Agent입니다.

이 에이전트에 따라 붙는 표현이 있는데요, 바로 self-improving입니다. 풀어 쓰면 쓸수록 나아지는 도구란 거죠. 소개만 봐도 구미가 당깁니다. 쓸수록 나아지는 AI 에이전트라니요.
오늘은 그 소문의 도구를 살펴보려고 합니다. Hermes Agent라는 에이전트 서비스가 어떤 도구인지, self-improving이란 메커니즘은 코드 안에 어떻게 들어가 있는지, 실제로 깔아 쓰려면 무엇을 해야 하는지 정리했습니다. 공식 문서와 GitHub 저장소 기준, 주요 커뮤니티들 반응 기준으로 찾아왔습니다.
그 전에요, 먼저 에이전트 서비스라는 단어부터 짚고 가겠습니다. 우리가 흔히 쓰는 AI랑 달라서 풀어 두는 게 좋습니다. 간단한 표로 보면 이렇습니다.

ChatGPT나 Claude 데스크탑은 내가 창을 열어 말을 거는 도구입니다. 창을 닫으면 멈춰요. 반면 에이전트 서비스는 서버에서 계속 돌고 있는 상주 작업자에 가깝습니다. 노트북을 닫아도 작업이 이어지고, 디스코드나 텔레그램으로 말을 걸면 바로 답이 옵니다. 2025년 말에 나온 Openclaw(구 Clawbot-Moltbot)가 이 서비스의 문을 활짝 열었습니다. 꽤 큰 화제가 되었죠.
Hermes Agent는 그 라인에서 새로 나온 서비스입니다. Nous Research가 MIT 라이선스로 공개한 오픈소스 에이전트고, 공식 페이지의 한 줄 정의는 이렇습니다.
The Agent that grows with you.
당신과 함께 자라는 에이전트.

그렇게 출시 두 달 반 만에 Hermes Agent는 사용량 1위로 올라섰습니다. 지금까지 이 에이전트 서비스에 쓰인 누적 토큰은 1조 200억 개에 달한다고 합니다. GitHub star로만 봐도 출시 11주 차만에 14만 5천 개를 찍었죠.
공식 정의와 문구를 살펴봐도 이 에이전트의 핵심은 스스로 성장하는(self-improving) 데 있습니다. 그 뜻이야 이해한다만, 궁금증이 생겼습니다. 에이전트가 어떻게 알아서 성장한다는 걸까요?
오픈소스 에이전트니까 GitHub 저장소 구조를 직접 봤습니다. 자가 성장 구조와 관련된 핵심 디렉토리는 셋이었습니다.
agent/ 에이전트 루프 본체. 학습 루프가 매 작업마다 굴러가는 곳skills/ 절차적 기억(procedural memory)이 모이는 디렉토리environments/ 강화학습(RL) 환경. 사용 흔적을 다음 세대 모델 학습 데이터로 변환
그 구조 안에서 self-improving은 네 가지 메커니즘으로 갈라져 굴러가고 있습니다.

공식 문서에는 도구 호출(tool call) 다섯 번 이상의 작업을 마치면 그 절차를 마크다운 문서로 자동 저장한다고 나옵니다. 저장되는 위치는 ~/.hermes/skills/. 에이전트의 절차 기억(procedural memory) 영역입니다. 이처럼 skill의 생성과 저장이 일어나는 시점은 네 가지로 명시돼 있죠.
모든 작업을 무작정 저장하지 않는다는 점이 눈에 띄네요. 다시 쓸 만한 절차만 골라 남긴다는 거죠. 정해진 환경 안에 그 사람이 하는 일에 맞춘 절차 라이브러리가 시간이 갈수록 쌓이는 흐름이고요.
+한편 이러한 사용의 흔적은 environments/ 디렉토리의 Atropos RL 환경을 거쳐 다음 세대 도구 사용 모델의 학습 데이터(trajectory)로도 변환·압축됩니다. 일반 사용자가 매일 만질 부분은 아니지만, 내 사용이 다음 세대 모델을 키운다는 맥락이 코드 구조로 드러나는 곳이고요. (내 작업 구조가 노출되는 만큼 싫다면 이 기능을 끄는 것도 방법입니다)
이렇게 저장한 스킬, 즉 일의 절차는 슬래시 명령으로 부를 수 있어요. 흔히 아는 대로 /<skill-name> 형태고요. 당연히 사용자가 직접 호출하지 않아도 비슷한 상황이 오면 에이전트가 알아서 검색합니다.
이때 메모리 검색에는 SQLite의 내장 텍스트 검색 기능(FTS5)을 씁니다. SQLite는 거의 모든 운영체제에 이미 깔려 있는 가벼운 데이터베이스고요. 보통 AI 도구들이 기억 검색을 위해 별도 벡터 DB를 외부에 두는데, Hermes는 시스템에 있는 SQLite로 처리해 문제를 이겨냈습니다. 1만 개 넘는 문서를 약 10밀리초 안에 뒤지고, 5달러짜리 가상 서버에서도 돌아갈 만큼 인프라가 가볍다고 합니다.
+여기에 다른 사람이 만든 절차를 받아 쓸 수도 있죠. Skills Hub라는 마켓플레이스로, agentskills.io 공개 표준을 따릅니다. 공식 저장소·skills-sh(Vercel 디렉토리)·GitHub·clawhub·lobehub 같은 여러 소스에서 npm 패키지처럼 검색하고 설치할 수 있습니다.
한 번 저장한 스킬을 그대로 두는 것도 아닙니다. 내장 메모리 도구가 있어서 에이전트가 사용 중에 자기 기록을 add·replace·remove로 직접 수정하죠. 처음 만든 절차가 부정확했거나, 환경이 바뀌었거나, 더 나은 방법을 찾았을 때 스스로 고치는 흐름입니다.
이런 메모리의 핵심 파일은 두 개입니다. 에이전트의 개인 노트라고 볼 수 있는 ~/.hermes/memories/MEMORY.md와 사용자 맞춤 프로필인 USER.md. 두 개 파일이 세션이 시작될 때면 시스템 프롬프트에 고정 스냅숏으로 들어가고, 에이전트가 그 도구로 그때그때 갱신해요.
다시, 이 기본 메모리 위에 외부 메모리 백엔드가 더 붙습니다. 그중 Honcho 기반이 의미 있는데요. 사용자의 발화·선호·작업 패턴을 누적해서 이 사용자는 누구인가의 모델을 세션 너머에서 유지한다고 합니다. 즉, 다음 세션에서 처음부터 다시 설명하지 않아도 알아서 에이전트가 사용자를 기억한다는 거죠.
이렇게 네 가지 구조가 self-improving이라는 표현을 뒷받침합니다. 그저 마케팅 카피라고만 보기에는 꽤 괜찮게 코드 레벨에서 돌아가는 구조로 보입니다.
그럼 어떻게 쓸 수 있을까요? 공식 quickstart 기준으로, 단계를 정리했습니다.

설치 명령은 간단합니다. OS에 따라 명령어를 바꿔, 터미널에서 그대로 입력하면 됩니다.
macOS·Linux·WSL2·Termux
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
Windows (PowerShell, Early beta)
irm https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.ps1 | iex
설치가 끝나면 source ~/.bashrc(zsh 사용자는 ~/.zshrc)하고 hermes를 입력하면 시작할 수 있습니다. 다만, 현재 기준으로 윈도우 네이티브는 얼리 베타 상태라 공식 문서에서도 WSL2를 권하네요.
설정 단계에서는 아래 명령어 순서로 진행됩니다. 첫 설치 직후의 기본 설정(OOTB) 완성도가 인상적이라는 평이 있는 만큼, 꽤 깔끔하게 접근할 수 있습니다.
hermes setup # 전체 설정 마법사
hermes model # LLM provider 선택
hermes tools # 도구 활성화
hermes gateway # 메신저 연결
이 중에도 성능을 가장 크게 좌우하는 건 결국 두뇌 역할을 하는 모델이겠죠. Hermes Agent에서는 웬만한 LLM은 공식 지원합니다. Claude·OpenAI·OpenRouter·Nous Portal·DeepSeek·Kimi·Alibaba Qwen·NVIDIA Nemotron·AWS Bedrock에 더해 vLLM·Ollama 같은 로컬 모델 엔드포인트도 받죠.
다만 한 가지 제약이 있는데, 모델 컨텍스트 창이 최소 6만 4천 토큰 이상이어야 합니다. 대부분 상용 모델은 이 조건을 쉽게 넘으니 괜찮을 겁니다.
모델 다음으로 에이전트를 쓰는 흐름에서 중요한 건 “어디서 대화하냐”, “어디에 저장하냐” 이렇게 두 가지일 겁니다. Hermes가 지원하는 구성은 이렇습니다. 많아서 좋네요.
무엇보다 “에이전트 서비스”는 꽤 제약이 많습니다. 내 컴퓨터와 계정의 거의 모든 권한을 넘겨주는 거니까요. 그래서 굳이 두 개 이상의 에이전트 서비스를 돌릴 필요가 없습니다. 그래서인지 Hermes Agent는 똑똑하게 Openclaw 마이그레이션을 아주 손쉽게 지원합니다. 아래 명령어로 구동하죠.
hermes claw migrate # 대화형, 전체 자동
hermes claw migrate --dry-run # 미리보기
hermes claw migrate --preset user-data # 시크릿(API 키) 제외
hermes setup 마법사가 ~/.openclaw 디렉토리를 자동으로 찾아서 설정 단계에 먼저 묻습니다. 가져오는 항목이 꽤 폭넓어요.

물론 이것 역시 함께 자라는 에이전트라는 정체성을 도구 너머까지 이어 둔 셈입니다. 도구를 옮긴다고 누적된 학습 자산이 사라지지 않는다는 거죠.
무작정 추천하기에 앞서 실제로 레딧을 비롯한 커뮤니티에서 한 달 넘게 굴려봤다는 사람들의 평도 가져왔습니다. (사실 저도 이제 유행에 올라타 탐색하기 시작했거든요. 도움을 좀 받기로 했습니다.)
긍정적인 평은 단순합니다. Hermes로 옮겼다, 후회 없다는 마이그레이션 후기가 눈에 띄네요. OpenClaw가 매 업데이트마다 깨졌고 디버깅에만 시간을 다 쓰던 것들을 아꼈다며, 안정성을 높게 쳐줍니다. 누적해서 성장하려면 일단 깨지지 않는 안정성이 중요하니까요. 잘 설계된 온보딩과 마이그레이션도 긍정적으로 평가받습니다.
다만, 무지성으로 좋다는 건 경계해야 합니다. 기본 설정 인상이 너무 강해서 준비됐다고 과대평가하기 쉽지만, 진짜 도전은 그 다음에 시작된다는 말도 있고, 데모는 데모일 뿐이라는 익숙한 말도 있습니다. 스킬 포이즈닝·MCP 서버 샌드박스 부재·자격 증명 노출·GDPR 미해결을 짚으며, 1인 개발자에는 적합하지만 규제·결제·감사가 필요한 팀 워크플로에는 부적합하다는 평도 봤습니다. 이건 분명 에이전트 서비스의 한계와도 맞닿아 있네요.
한국에는 최근 밋업이 열리는 등 조금씩 보급이 시작되고 있는 단계인데요, (AI의 도움을 얻었다고 하나) 한글로 쓰인 위키가 빠르게 나왔으니 참조해봐도 좋겠습니다.
출처: r/openclaw 마이그레이션 후기 · r/WebAfterAI 안정성 평 · r/hermesagent 한 달 사용기 · Krzysztof Słomka Medium 리뷰
헤르메스 에이전트 공식 사이트에는 121개의 사용자 스토리가 올라와 있습니다. X, 레딧, GitHub, 유튜브 등에서 수집한 실제 사용기인데, 유형별로 추려보면 이 에이전트가 개발자 전용 도구를 이미 넘어서 있다는 걸 알 수 있습니다.

개발자 워크플로우를 비롯해 개인 비서는 물론이고요, 인쇄 공장의 비즈니스 전문가, 동화 작가, 트레이딩 봇까지 다양한 쓰임새가 눈에 띕니다.
지금까지 에이전트 서비스는 처음 동작하는 것을 보는 신기함 정도에 머물러 있었을 지도 모릅니다. 자율적으로 브라우저를 켠다, 멀티 스텝으로 결제까지 한다 같은 데모가 박수를 받는 단계였고요.
그러나 Hermes Agent가 보여 주는 흐름은 분명 그 다음 영역입니다. 신기함을 넘어, 쓰면서 본인 워크플로에 맞춰지는 도구가 이제 필요하다는 걸 보여준 거죠. 게다가 메커니즘 레벨에서 이를 구현한 방식도 인상적입니다.
그러니 곧바로 똑똑해진다보다 쓸수록 워크플로에 맞춰진다가 더 정확한 표현일 듯해요. 출시와 함께 미친듯 Hype을 받던 Openclaw와 다르게, 두어달이 지난 지금 1위를 탈환한 것 역시 그 특성 때문은 아닐까요? 한 달 굴린 다음에야 진짜 모양이 드러나는 도구라는 의미입니다.
그럼 이제, 다음 에이전트 서비스는 어디로 가야하는 걸까요?
©️요즘IT의 모든 콘텐츠는 저작권법의 보호를 받는 바, 무단 전재와 복사, 배포 등을 금합니다.