헤르메스 에이전트 설치 가이드: 로컬·Docker·Slack 30분 완성 [2편]

TL;DR

헤르메스 에이전트는 pip install hermes-agent 한 줄과 API 키 하나로 로컬 설치가 완료된다.
llama.cpp·LM Studio·Ollama 세 가지 로컬 모델 백엔드를 지원하며, 보안 환경에서는 Qwen 3.6 35B가 현실적인 기본값이다.
Docker 배포 + Slack/Telegram 웹훅 설정까지 포함하면 팀 단위 운용 환경이 30분 내로 갖춰진다.

시리즈 목차

편

주제

1편	소개 — 무엇이 다른가
2편	설치 가이드 (현재 글)
3편	스킬 시스템 완전 분해
4편	자동화 워크플로우 실전
5편	실무 도입 결론

설치 전 확인사항

헤르메스 에이전트를 설치하기 전에 실행 모드를 먼저 결정한다.

모드

요구사항

적합한 환경

클라우드 모델	Python 3.11+, API 키	개인 사용, 빠른 시작
로컬 모델	Python 3.11+, GPU (VRAM 8GB+)	보안 민감 팀, 비용 절감
Docker	Docker 20.10+	서버 배포, 팀 공유

기본 설치 (클라우드 모델)

# Python 3.11 이상 권장 pip install hermes-agent

# 설치 확인 hermes --version

초기 설정 파일을 생성한다.

hermes init

~/.hermes/config.yml이 생성되며, 사용할 LLM 백엔드를 지정한다.

# ~/.hermes/config.yml llm: provider: openai # openai | anthropic | nvidia | local model: gpt-4o # 또는 claude-opus-4-7, deepseek-v3, etc. api_key: ${OPENAI_API_KEY} skills: directory: ~/.hermes/skills auto_generate: true # 5회 이상 도구 호출 시 자동 스킬 생성

memory: backend: sqlite # sqlite (기본값, 로컬 FTS5) path: ~/.hermes/memory.db

로컬 모델 설정 (Ollama 기준)

보안 환경이나 비용 절감이 필요한 팀은 Ollama를 통한 로컬 모델을 권장한다.

# Ollama 설치 (macOS/Linux)
curl -fsSL https://ollama.com/install.sh | sh
# Qwen 3.6 35B 다운로드 (약 20GB)
ollama pull qwen3:35b# Ollama 서버 실행
ollama serve

헤르메스 config에서 로컬 백엔드로 전환한다.

# ~/.hermes/config.yml
llm:
  provider: local
  backend: ollama
  base_url: http://localhost:11434
  model: qwen3:35b

모델 선택 가이드:

모델

VRAM

성능

권장 상황

Qwen 3.6 35B	~20GB	120B급	팀 서버 표준
Qwen 3.6 7B	~8GB	빠른 응답	개인 노트북
Llama 3.3 70B	~40GB	고성능	DGX Spark 등 전용 서버

Docker 배포

팀 서버에 고정 배포하는 경우 Docker를 사용한다. 에이전트가 상시 실행되며 Telegram·Slack 메시지를 수신한다.

# 프로젝트 디렉터리 생성
mkdir hermes-deploy && cd hermes-deploy
# docker-compose.yml 작성
cat > docker-compose.yml << 'EOF'
version: '3.8'
services:
  hermes:
    image: nousresearch/hermes-agent:latest
    restart: unless-stopped
    environment:
      - HERMES_LLM_PROVIDER=${LLM_PROVIDER}
      - HERMES_LLM_MODEL=${LLM_MODEL}
      - HERMES_LLM_API_KEY=${LLM_API_KEY}
      - TELEGRAM_BOT_TOKEN=${TELEGRAM_BOT_TOKEN}
      - SLACK_BOT_TOKEN=${SLACK_BOT_TOKEN}
      - SLACK_APP_TOKEN=${SLACK_APP_TOKEN}
    volumes:
      - ./skills:/root/.hermes/skills
      - ./memory:/root/.hermes/memory
    ports:
      - "8080:8080"
EOF# 실행
docker compose up -d

skills와 memory 디렉터리를 볼륨 마운트하면 컨테이너를 재시작해도 누적된 스킬이 유지된다. 팀 Git 저장소에 skills 디렉터리를 커밋하면 팀원 전체가 공유된 스킬을 사용할 수 있다.

Telegram 연동

헤르메스에서 가장 빠르게 팀 실무에 붙이는 방법이다.

# 1. @BotFather에서 봇 생성 후 토큰 발급 # 2. 환경변수 설정 export TELEGRAM_BOT_TOKEN="your-bot-token"

# 3. 헤르메스 Telegram 모드 실행 hermes start --interface telegram

이후 팀원이 Telegram 봇 채팅방에서 직접 에이전트에게 작업을 지시할 수 있다. 크론 스케줄링을 설정하면 정해진 시간에 자동 리포트도 발송된다.

Slack 연동 (Socket Mode)

카카오·네이버·토스처럼 Slack을 사내 협업 도구로 쓰는 팀에 적합하다.

# Slack App 생성 후 필요한 권한: # - app_mentions:read # - chat:write # - channels:history export SLACK_BOT_TOKEN="xoxb-..." export SLACK_APP_TOKEN="xapp-..."

hermes start --interface slack

Slack 채널에서 @hermes [작업 내용] 형태로 호출하면 된다. 에이전트 작업 로그가 채널에 남아 투명성이 확보된다.

설치 후 첫 실행 확인

# CLI로 첫 작업 요청
hermes ask "현재 디렉터리의 Python 파일에서 import 구문을 모두 추출하고 요약해줘"
# 스킬 목록 확인
hermes skills list# 메모리 상태 확인
hermes memory status

처음 몇 번의 복잡한 작업 후 ~/.hermes/skills/ 디렉터리에 자동 생성된 Markdown 스킬 파일을 확인할 수 있다. 이 파일들이 헤르메스가 축적하는 경험이다.

다음 편 예고

3편에서는 스킬 시스템을 해부한다.

스킬 파일 내부 구조 (YAML 프론트매터 + 본문)
SQLite FTS5 검색이 임베딩보다 나은 상황
직접 스킬 작성 및 팀 공유 방법
스킬 품질 관리 전략

참고 자료