TL;DR
- 헤르메스 에이전트는
pip install hermes-agent한 줄과 API 키 하나로 로컬 설치가 완료된다. - llama.cpp·LM Studio·Ollama 세 가지 로컬 모델 백엔드를 지원하며, 보안 환경에서는 Qwen 3.6 35B가 현실적인 기본값이다.
- Docker 배포 + Slack/Telegram 웹훅 설정까지 포함하면 팀 단위 운용 환경이 30분 내로 갖춰진다.
시리즈 목차
| 편 | 주제 |
| 1편 | 소개 — 무엇이 다른가 |
| 2편 | 설치 가이드 (현재 글) |
| 3편 | 스킬 시스템 완전 분해 |
| 4편 | 자동화 워크플로우 실전 |
| 5편 | 실무 도입 결론 |
설치 전 확인사항
헤르메스 에이전트를 설치하기 전에 실행 모드를 먼저 결정한다.
| 모드 | 요구사항 | 적합한 환경 |
| 클라우드 모델 | Python 3.11+, API 키 | 개인 사용, 빠른 시작 |
| 로컬 모델 | Python 3.11+, GPU (VRAM 8GB+) | 보안 민감 팀, 비용 절감 |
| Docker | Docker 20.10+ | 서버 배포, 팀 공유 |
기본 설치 (클라우드 모델)
# Python 3.11 이상 권장
pip install hermes-agent# 설치 확인
hermes --version
초기 설정 파일을 생성한다.
hermes init
~/.hermes/config.yml이 생성되며, 사용할 LLM 백엔드를 지정한다.
# ~/.hermes/config.yml
llm:
provider: openai # openai | anthropic | nvidia | local
model: gpt-4o # 또는 claude-opus-4-7, deepseek-v3, etc.
api_key: ${OPENAI_API_KEY}skills:
directory: ~/.hermes/skills
auto_generate: true # 5회 이상 도구 호출 시 자동 스킬 생성
memory:
backend: sqlite # sqlite (기본값, 로컬 FTS5)
path: ~/.hermes/memory.db
로컬 모델 설정 (Ollama 기준)
보안 환경이나 비용 절감이 필요한 팀은 Ollama를 통한 로컬 모델을 권장한다.
# Ollama 설치 (macOS/Linux)
curl -fsSL https://ollama.com/install.sh | sh# Qwen 3.6 35B 다운로드 (약 20GB)
ollama pull qwen3:35b
# Ollama 서버 실행
ollama serve
헤르메스 config에서 로컬 백엔드로 전환한다.
# ~/.hermes/config.yml
llm:
provider: local
backend: ollama
base_url: http://localhost:11434
model: qwen3:35b
모델 선택 가이드:
| 모델 | VRAM | 성능 | 권장 상황 |
| Qwen 3.6 35B | ~20GB | 120B급 | 팀 서버 표준 |
| Qwen 3.6 7B | ~8GB | 빠른 응답 | 개인 노트북 |
| Llama 3.3 70B | ~40GB | 고성능 | DGX Spark 등 전용 서버 |
Docker 배포
팀 서버에 고정 배포하는 경우 Docker를 사용한다. 에이전트가 상시 실행되며 Telegram·Slack 메시지를 수신한다.
# 프로젝트 디렉터리 생성
mkdir hermes-deploy && cd hermes-deploy# docker-compose.yml 작성
cat > docker-compose.yml << 'EOF'
version: '3.8'
services:
hermes:
image: nousresearch/hermes-agent:latest
restart: unless-stopped
environment:
- HERMES_LLM_PROVIDER=${LLM_PROVIDER}
- HERMES_LLM_MODEL=${LLM_MODEL}
- HERMES_LLM_API_KEY=${LLM_API_KEY}
- TELEGRAM_BOT_TOKEN=${TELEGRAM_BOT_TOKEN}
- SLACK_BOT_TOKEN=${SLACK_BOT_TOKEN}
- SLACK_APP_TOKEN=${SLACK_APP_TOKEN}
volumes:
- ./skills:/root/.hermes/skills
- ./memory:/root/.hermes/memory
ports:
- "8080:8080"
EOF
# 실행
docker compose up -d
skills와 memory 디렉터리를 볼륨 마운트하면 컨테이너를 재시작해도 누적된 스킬이 유지된다. 팀 Git 저장소에 skills 디렉터리를 커밋하면 팀원 전체가 공유된 스킬을 사용할 수 있다.
Telegram 연동
헤르메스에서 가장 빠르게 팀 실무에 붙이는 방법이다.
# 1. @BotFather에서 봇 생성 후 토큰 발급# 2. 환경변수 설정
export TELEGRAM_BOT_TOKEN="your-bot-token"
# 3. 헤르메스 Telegram 모드 실행
hermes start --interface telegram
이후 팀원이 Telegram 봇 채팅방에서 직접 에이전트에게 작업을 지시할 수 있다. 크론 스케줄링을 설정하면 정해진 시간에 자동 리포트도 발송된다.
Slack 연동 (Socket Mode)
카카오·네이버·토스처럼 Slack을 사내 협업 도구로 쓰는 팀에 적합하다.
# Slack App 생성 후 필요한 권한:
# - app_mentions:read
# - chat:write
# - channels:historyexport SLACK_BOT_TOKEN="xoxb-..."
export SLACK_APP_TOKEN="xapp-..."
hermes start --interface slack
Slack 채널에서 @hermes [작업 내용] 형태로 호출하면 된다. 에이전트 작업 로그가 채널에 남아 투명성이 확보된다.
설치 후 첫 실행 확인
# CLI로 첫 작업 요청
hermes ask "현재 디렉터리의 Python 파일에서 import 구문을 모두 추출하고 요약해줘"# 스킬 목록 확인
hermes skills list
# 메모리 상태 확인
hermes memory status
처음 몇 번의 복잡한 작업 후 ~/.hermes/skills/ 디렉터리에 자동 생성된 Markdown 스킬 파일을 확인할 수 있다. 이 파일들이 헤르메스가 축적하는 경험이다.
다음 편 예고
3편에서는 스킬 시스템을 해부한다.
- 스킬 파일 내부 구조 (YAML 프론트매터 + 본문)
- SQLite FTS5 검색이 임베딩보다 나은 상황
- 직접 스킬 작성 및 팀 공유 방법
- 스킬 품질 관리 전략
참고 자료