헤르메스 에이전트 설치 가이드: 로컬·Docker·Slack 30분 완성 [2편]

TL;DR

  • 헤르메스 에이전트는 pip install hermes-agent 한 줄과 API 키 하나로 로컬 설치가 완료된다.
  • llama.cpp·LM Studio·Ollama 세 가지 로컬 모델 백엔드를 지원하며, 보안 환경에서는 Qwen 3.6 35B가 현실적인 기본값이다.
  • Docker 배포 + Slack/Telegram 웹훅 설정까지 포함하면 팀 단위 운용 환경이 30분 내로 갖춰진다.

시리즈 목차

주제
1편 소개 — 무엇이 다른가
2편 설치 가이드 (현재 글)
3편 스킬 시스템 완전 분해
4편 자동화 워크플로우 실전
5편 실무 도입 결론

설치 전 확인사항

헤르메스 에이전트를 설치하기 전에 실행 모드를 먼저 결정한다.

모드 요구사항 적합한 환경
클라우드 모델 Python 3.11+, API 키 개인 사용, 빠른 시작
로컬 모델 Python 3.11+, GPU (VRAM 8GB+) 보안 민감 팀, 비용 절감
Docker Docker 20.10+ 서버 배포, 팀 공유

기본 설치 (클라우드 모델)

# Python 3.11 이상 권장
pip install hermes-agent

# 설치 확인 hermes --version

초기 설정 파일을 생성한다.

hermes init

~/.hermes/config.yml이 생성되며, 사용할 LLM 백엔드를 지정한다.

# ~/.hermes/config.yml
llm:
  provider: openai          # openai | anthropic | nvidia | local
  model: gpt-4o             # 또는 claude-opus-4-7, deepseek-v3, etc.
  api_key: ${OPENAI_API_KEY}

skills: directory: ~/.hermes/skills auto_generate: true # 5회 이상 도구 호출 시 자동 스킬 생성

memory: backend: sqlite # sqlite (기본값, 로컬 FTS5) path: ~/.hermes/memory.db


로컬 모델 설정 (Ollama 기준)

보안 환경이나 비용 절감이 필요한 팀은 Ollama를 통한 로컬 모델을 권장한다.

# Ollama 설치 (macOS/Linux)
curl -fsSL https://ollama.com/install.sh | sh

# Qwen 3.6 35B 다운로드 (약 20GB) ollama pull qwen3:35b

# Ollama 서버 실행 ollama serve

헤르메스 config에서 로컬 백엔드로 전환한다.

# ~/.hermes/config.yml
llm:
  provider: local
  backend: ollama
  base_url: http://localhost:11434
  model: qwen3:35b

모델 선택 가이드:

모델 VRAM 성능 권장 상황
Qwen 3.6 35B ~20GB 120B급 팀 서버 표준
Qwen 3.6 7B ~8GB 빠른 응답 개인 노트북
Llama 3.3 70B ~40GB 고성능 DGX Spark 등 전용 서버

Docker 배포

팀 서버에 고정 배포하는 경우 Docker를 사용한다. 에이전트가 상시 실행되며 Telegram·Slack 메시지를 수신한다.

# 프로젝트 디렉터리 생성
mkdir hermes-deploy && cd hermes-deploy

# docker-compose.yml 작성 cat > docker-compose.yml << 'EOF' version: '3.8' services: hermes: image: nousresearch/hermes-agent:latest restart: unless-stopped environment: - HERMES_LLM_PROVIDER=${LLM_PROVIDER} - HERMES_LLM_MODEL=${LLM_MODEL} - HERMES_LLM_API_KEY=${LLM_API_KEY} - TELEGRAM_BOT_TOKEN=${TELEGRAM_BOT_TOKEN} - SLACK_BOT_TOKEN=${SLACK_BOT_TOKEN} - SLACK_APP_TOKEN=${SLACK_APP_TOKEN} volumes: - ./skills:/root/.hermes/skills - ./memory:/root/.hermes/memory ports: - "8080:8080" EOF

# 실행 docker compose up -d

skills와 memory 디렉터리를 볼륨 마운트하면 컨테이너를 재시작해도 누적된 스킬이 유지된다. 팀 Git 저장소에 skills 디렉터리를 커밋하면 팀원 전체가 공유된 스킬을 사용할 수 있다.


Telegram 연동

헤르메스에서 가장 빠르게 팀 실무에 붙이는 방법이다.

# 1. @BotFather에서 봇 생성 후 토큰 발급

# 2. 환경변수 설정 export TELEGRAM_BOT_TOKEN="your-bot-token"

# 3. 헤르메스 Telegram 모드 실행 hermes start --interface telegram

이후 팀원이 Telegram 봇 채팅방에서 직접 에이전트에게 작업을 지시할 수 있다. 크론 스케줄링을 설정하면 정해진 시간에 자동 리포트도 발송된다.


Slack 연동 (Socket Mode)

카카오·네이버·토스처럼 Slack을 사내 협업 도구로 쓰는 팀에 적합하다.

# Slack App 생성 후 필요한 권한:
# - app_mentions:read
# - chat:write
# - channels:history

export SLACK_BOT_TOKEN="xoxb-..." export SLACK_APP_TOKEN="xapp-..."

hermes start --interface slack

Slack 채널에서 @hermes [작업 내용] 형태로 호출하면 된다. 에이전트 작업 로그가 채널에 남아 투명성이 확보된다.


설치 후 첫 실행 확인

# CLI로 첫 작업 요청
hermes ask "현재 디렉터리의 Python 파일에서 import 구문을 모두 추출하고 요약해줘"

# 스킬 목록 확인 hermes skills list

# 메모리 상태 확인 hermes memory status

처음 몇 번의 복잡한 작업 후 ~/.hermes/skills/ 디렉터리에 자동 생성된 Markdown 스킬 파일을 확인할 수 있다. 이 파일들이 헤르메스가 축적하는 경험이다.


다음 편 예고

3편에서는 스킬 시스템을 해부한다.

  • 스킬 파일 내부 구조 (YAML 프론트매터 + 본문)
  • SQLite FTS5 검색이 임베딩보다 나은 상황
  • 직접 스킬 작성 및 팀 공유 방법
  • 스킬 품질 관리 전략

참고 자료

댓글 남기기