TL;DR
- Nous Research가 2026년 2월 출시한 오픈소스 AI 에이전트 헤르메스(Hermes)가 3개월 만에 OpenRouter 일일 처리 토큰 1위(224B tokens/day)를 기록했다.
- 헤르메스의 핵심은 “스킬 시스템”이다. 복잡한 작업을 완료할 때마다 Markdown 스킬 파일을 자동 생성해 다음 작업에 재사용하며, 쓸수록 빨라지고 정교해진다.
- GitHub 140,000+ stars, MIT 라이선스, Telegram/Slack/Discord 연동 지원으로 국내 팀 실무 도입 문턱이 낮다.
이 시리즈를 시작하는 이유
3개월 만에 GitHub 스타 14만 개.
일반적인 오픈소스 프로젝트라면 기억에 남을 수치다. 헤르메스 에이전트는 그것을 AI 에이전트 분야에서 해냈다. 경쟁자인 OpenClaw가 쌓아온 37만 스타를 단기 모멘텀에서 앞질렀고, 2026년 5월 기준 OpenRouter에서 하루 2,240억 토큰을 처리하며 글로벌 AI 에이전트 사용량 1위에 올라섰다.
수치보다 흥미로운 건 이유다. 헤르메스는 단순히 더 빠른 에이전트가 아니다. 에이전트가 어떻게 학습하고, 경험을 어떻게 축적하며, 팀 단위에서 어떻게 공유할 수 있는지에 대한 다른 답을 제시한다.
이 시리즈는 헤르메스 에이전트를 5편에 걸쳐 다룬다.
| 편 | 주제 |
| 1편 | 소개 — 무엇이 다른가 (현재 글) |
| 2편 | 설치 가이드 — 로컬·Docker·클라우드 |
| 3편 | 스킬 시스템 완전 분해 |
| 4편 | 자동화 워크플로우 실전 |
| 5편 | 실무 도입 결론 — 언제 쓰고 언제 말아야 하나 |
기존 AI 에이전트의 문제
현재 대부분의 AI 에이전트는 무상태(stateless) 다. 세션이 끝나면 기억이 초기화되고, 다음 작업은 다시 처음부터 추론한다. React 리렌더링 버그를 어제 해결했어도 오늘 같은 유형의 버그를 만나면 처음부터 분석을 반복한다.
더 큰 문제는 팀 단위로 가면 두드러진다. 한 명이 쌓은 에이전트 경험이 다른 팀원에게 이전되지 않는다. 에이전트를 잘 쓰는 방법이 개인 노하우로 묻힌다.
헤르메스는 이 문제를 “스킬 파일”이라는 구체적인 메커니즘으로 해결한다.
핵심 개념: 스킬 시스템
헤르메스 에이전트는 작업 완료 후 자동으로 스킬 파일(Markdown)을 생성한다. 기준은 단순하다. 도구 호출이 5회 이상인 복잡한 작업이 끝나면, 에이전트가 스스로 접근 방식과 경계 케이스를 정리해 파일로 저장한다.
다음에 유사한 작업이 들어오면, 에이전트는 스킬 파일을 로드해 처음부터 추론하지 않고 기존 지식을 활용한다. TokenMix의 측정에 따르면, 스킬이 축적된 에이전트는 신규 에이전트 인스턴스 대비 연구 작업 시간을 평균 40% 단축한다.
flowchart TD
A[사용자 작업 요청] --> B{도구 호출 5회 이상?}
B -- No --> C[일반 응답 반환]
B -- Yes --> D[작업 완료]
D --> E[스킬 파일 자동 생성\n접근법 + 경계 케이스 + 도메인 지식]
E --> F[(스킬 저장소\n.md 파일 + SQLite FTS5)]
F --> G[다음 유사 작업 시 스킬 로드]
G --> H[추론 없이 빠른 처리]
스킬 파일은 Markdown이기 때문에 사람이 직접 읽고 편집할 수 있다. 팀에서 쌓인 스킬을 Git으로 버전 관리하거나 PR로 리뷰하는 워크플로우가 자연스럽게 성립한다.
3계층 메모리 아키텍처
헤르메스의 메모리는 단일 벡터 DB가 아니다. 세 계층으로 나뉜다.
| 계층 | 구현 | 특징 |
| 스킬 파일 | Markdown + YAML 프론트매터 | 사람이 읽고 편집 가능 |
| 세션 색인 | SQLite FTS5 키워드 검색 | 임베딩 유사도 아닌 정확한 키워드 매칭 |
| 사용자 모델 | Honcho 라이브러리 | 스택 선호도, 축약어 패턴, 작업 스타일 추적 |
SQLite FTS5 기반 키워드 검색을 선택한 이유가 흥미롭다. 임베딩 유사도 검색은 “비슷한” 사례를 찾는 데 유리하지만, 에이전트가 정확한 기술 스택이나 에러 메시지로 검색할 때는 키워드 매칭이 재현성이 높다. 디버깅 친화적이고, 외부 임베딩 API 비용도 없다.
OpenClaw와 무엇이 다른가
OpenClaw는 AI 에이전트 생태계를 사실상 개척한 프레임워크다. GitHub 370,000+ stars라는 레거시가 그것을 말한다. 그러나 2026년 1분기를 기점으로 상황이 달라졌다.
나흘 만에 CVE 9개가 공개됐고, 보안 감사 기업 Koi Security는 커뮤니티 스킬 저장소(ClawHub)에서 341개의 악성 항목을 발견했다. OpenClaw 창업자가 OpenAI에 합류하며 프로젝트 방향성도 흔들렸다.
헤르메스가 채운 공백은 단순히 “더 안전한 대안”이 아니다. 스킬 파일의 투명성, SQLite 기반의 로컬 색인, MIT 라이선스 등이 조합되어 팀 단위 신뢰성 있는 배포를 가능하게 한다.
한국 개발 환경에서의 접점
헤르메스가 국내 팀에서 주목받는 이유 중 하나는 Slack 연동이다. 사내 Slack에서 헤르메스에게 작업을 지시하고, 크론 스케줄링으로 주간 리포트 자동 생성, PR 리뷰 요약, 배포 상태 모니터링 같은 작업을 자동화할 수 있다.
카카오·네이버·토스처럼 Slack을 주 협업 도구로 쓰는 팀에서는 별도 UI 없이 기존 채널에서 에이전트를 운용하는 구조가 자연스럽다. 에이전트 호출 기록이 채널에 남으므로 투명성 확보도 된다.
로컬 실행 측면에서는 Qwen 3.6 35B 모델이 현재 가장 현실적인 선택지로 꼽힌다. 약 20GB VRAM으로 120B급 성능을 내며, 국내 보안 정책상 API 외부 전송을 제한하는 환경에서도 사내 GPU 서버에 올려 쓸 수 있다.
다음 편 예고
2편에서는 헤르메스 에이전트를 실제로 설치한다.
- 로컬 환경 (llama.cpp, LM Studio, Ollama)
- Docker 컨테이너 배포
- Telegram·Slack 연동 설정
- 권장 모델 선택 가이드
참고 자료