文章背景图

Hermes Agent用1周后,OpenClaw我直接卸载了|Hermes科普,部署看这一篇就够了

2026-04-11
11
-
- 分钟

你有没有遇到过这种情况:跟OpenClaw聊了一个小时,他突然宕机不回复,下次又从零开始?

它不记得你是谁、不记得上次聊了什么、更不记得你踩过什么坑。

这就是OpenClaw最大的问题。——不稳定

而2026年2月,一个叫 Hermes Agent 的开源项目横空出世,两个月GitHub狂揽33000+星、4200+ fork、142位贡献者。它做了一件所有AI Agent都在喊但没做到的事:

让AI真正"记住"你,稳定的想方设法地解决问题,越用越聪明。

一、Hermes Agent是什么?

一句话:一个能自我进化的开源AI Agent框架

Nous Research(就是那个训练了Hermes系列大模型的团队)开发,MIT协议开源。它不是某个大模型的套壳聊天界面,而是一个完整的自主智能体系统——有自己的记忆、技能库、工具链,能跨平台运行,并且用得越久能力越强。

核心定位:你不需要打开ChatGPT的网页,你在Telegram上发一句话,它就能帮你干活。

搜资料、写代码、管文件、定时任务、发邮件、操作浏览器——全部通过你日常使用的聊天软件完成。


二、它凭什么这么火?—— 五个颠覆性特性

1. 闭环学习系统:用得越久越聪明

这是Hermes最核心的差异化。

传统AI Agent每次对话都是"失忆"状态。Hermes做了一件事:每次完成一个复杂任务后,自动生成一份"技能文档"(Skill)

比如你让它"部署一个Docker化的Python项目到VPS",它第一次可能摸索着来,但完成后会自动生成一份skill文件,记录完整步骤和踩过的坑。下次你再让它做类似的事,它直接调用这个技能,又快又准。

这就是"程序性记忆"——AI不只记住了发生了什么,还记住了怎么做才最好。

闭环学习流程:

接收任务 → 执行+调用工具 → 自动生成Skill文档 → 下次直接复用+自我改进 → 循环

而且skill在使用过程中还会自我改进。每15次工具调用,Hermes会做一次自我评估,发现不完善的地方就自动更新技能文档。

2. 三层记忆架构

Hermes的记忆不是简单的对话历史,而是一套精心设计的三层系统:

层级

名称

作用

实现方式

触发条件

第一层

Prompt记忆

始终在上下文里的核心信息

MEMORY.md + USER.md,约1300 tokens

每次对话自动注入,冻结不变

第二层

技能记忆

解决特定任务的程序性知识

Markdown技能文档,~/.hermes/skills/

复杂任务完成后自动创建,按需加载

第三层

会话记忆

所有历史对话可搜索回溯

SQLite + FTS5全文搜索 + LLM摘要

Agent主动调用session_search时触发

关键设计:会话记忆不在默认上下文里,避免撑爆token窗口。只有当Agent明确需要查历史时,才通过搜索调用。这让系统提示词保持精简和稳定,同时不丢失任何历史信息。

3. 15+平台通讯网关

Hermes不是只能在终端里用。它有一个统一的消息网关(Messaging Gateway),一个后台进程同时连接:

平台类型

具体平台

国际主流

Telegram、Discord、Slack、WhatsApp、Signal、iMessage

国内办公

飞书、钉钉、企业微信

协议平台

Matrix、Mattermost

智能家居

Home Assistant

传统通讯

Email、SMS

甚至支持语音消息自动转文字。你在手机上发一条Telegram消息,Hermes在服务器上执行,结果直接回给你。完全不需要SSH登录任何机器。

4. 47个内置工具 + MCP协议扩展

Hermes开箱即用就带了47个工具:

工具类别

具体能力

文件操作

读写、搜索、diff编辑

终端执行

本地、Docker、SSH、云端沙箱(6种后端)

Web能力

搜索、网页提取、浏览器自动化

代码执行

内建Python沙箱,可压缩多步工具调用为单次推理

通讯集成

邮件、日历、Notion、GitHub、Linear

媒体处理

TTS语音合成、图像分析

任务调度

Cron定时任务,结果推送到任意平台

并行委派

可同时启动多个子Agent处理独立任务

还不够?通过 MCP(Model Context Protocol) 协议,可以接入任何外部工具服务。从v0.6.0开始,Hermes甚至可以自己作为MCP服务器对外暴露能力

5. 模型自由:200+模型随意切换

提供方

特点

Nous Portal

订阅制,零配置

OpenRouter

200+模型,按量付费

OpenAI / Anthropic

直接用官方API

自部署端点

vLLM、SGLang等任何OpenAI兼容API

切换模型一行命令搞定:hermes model,零代码改动。


三、核心架构解析

Hermes的架构可以概括为"一个核心循环 + 四大子系统"

Agent核心循环

Hermes的核心是一个同步的Agent循环(AIAgent类)。每次循环:

用户消息 → LLM推理 → 决定调用工具 → 执行工具 → 结果返回LLM → 继续推理或回复用户

关键优化:execute_code工具可以把多步工具调用压缩成单次推理。比如"搜10个网页并提取关键信息"这种任务,不需要10轮对话,一轮execute_code写个Python循环就搞定了。

四大子系统

子系统

职责

关键特性

Skills系统

程序性记忆

自动创建、自动改进、兼容agentskills.io开放标准、社区Skills Hub

Memory系统

持久化记忆

SOUL.md(人格)、USER.md(用户画像)、SQLite会话库(全文搜索+LLM摘要)

Gateway系统

通讯网关

单进程多平台并发、Session持久化、心跳检测主动检查邮件/日历

Cron系统

定时调度

自然语言创建任务、cron表达式、结果推送到任意平台、支持脚本预处理


四、部署指南:从零到跑起来

方式一:一键安装(推荐)

Linux / macOS / WSL2 一行命令:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

自动安装:Python 3.11(通过uv)、Node.js v22、ripgrep、ffmpeg,克隆代码,创建虚拟环境,运行配置向导。

安装完后:

source ~/.bashrc   # 或 source ~/.zshrc hermes setup       # 配置API Key hermes             # 启动!

整个过程不超过2分钟。

方式二:Docker部署

docker run -it nousresearch/hermes-agent          # CLI模式 docker run -d nousresearch/hermes-agent gateway    # Gateway模式(后台)

方式三:手动安装(完全控制)

git clone --recurse-submodules https://github.com/NousResearch/hermes-agent.git cd hermes-agent curl -LsSf https://astral.sh/uv/install.sh | sh uv venv venv --python 3.11 export VIRTUAL_ENV="$(pwd)/venv" uv pip install -e ".[all]"

可选模块按需装:

模块

功能

命令

messaging

Telegram / Discord 网关

uv pip install -e ".[messaging]"

cron

定时任务调度

uv pip install -e ".[cron]"

modal

Modal云端执行

uv pip install -e ".[modal]"

tts-premium

ElevenLabs高级语音

uv pip install -e ".[tts-premium]"

mcp

MCP协议支持

uv pip install -e ".[mcp]"

homeassistant

智能家居集成

uv pip install -e ".[homeassistant]"

方式四:云端沙箱部署

后端

适用场景

特点

本地

个人电脑

直接执行,零配置

Docker

安全隔离

容器化运行

SSH

远程服务器

连接已有VPS

Daytona

云端开发环境

空闲时休眠,几乎不花钱

Modal

GPU推理

无服务器,按量计费

Singularity

HPC集群

高性能计算容器

最经济方案:$5/月VPS + OpenRouter按量付费,月总成本$10-20。

配置消息平台

hermes gateway setup    # 交互式配置向导

以Telegram为例:在 @BotFather 创建Bot拿到Token → 运行setup → 填入Token → 完成。


五、Hermes vs OpenClaw:2026年两大开源AI Agent正面对决

聊开源AI Agent,2026年绕不开两个名字:Hermes Agent 和 OpenClaw

OpenClaw(前身为Clawdbot / Moltbot)由PSPDFKit创始人Peter Steinberger开发,72小时内GitHub狂揽6万星,被很多人称为"最接近JARVIS的开源项目"。两个项目都是MIT协议开源、都支持多平台通讯、都有记忆系统——但设计哲学完全不同。

设计哲学:中心化 vs 同心圆


OpenClaw 🦞

Hermes Agent 🧠

架构模式

Hub-Spoke(中心辐射)

Concentric Growth(同心圆扩展)

核心出发点

基础设施优先

Agent优先

一句话概括

一个中心Gateway统一调度所有渠道

从Agent核心向外生长,技能记忆工具都围绕Agent本身

类比

更像一个强大的中央控制系统

更像一个持续成长的个人

核心维度逐项对比

对比维度

OpenClaw 🦞

Hermes Agent 🧠

谁更强

记忆系统

文件级记忆(SOUL.md + 记忆文件),手动管理为主

三层架构(Prompt + 技能 + 会话),FTS5搜索 + LLM自动摘要

🧠 Hermes

自学习能力

无原生技能学习层,每次任务从头执行

自动生成技能文档,使用中自我改进,每15次工具调用做自评

🧠 Hermes

技能生态

52+内置技能,ClawHub社区生态

40+内置工具,agentskills.io开放标准

各有所长

渠道覆盖

WhatsApp、Telegram、Discord、iMessage、Slack、浏览器聊天

15+平台(含Signal、飞书、钉钉、企业微信)

🦞 OpenClaw

模型支持

BYOK:Claude、GPT、Gemini、xAI、Groq

200+(OpenRouter)、Nous Portal、任意兼容端点

🧠 Hermes

部署灵活性

本地 + getclaw托管 + DigitalOcean一键部署

6种后端(本地/Docker/SSH/Daytona/Modal/Singularity)

🧠 Hermes

安全机制

设备配对、Gateway认证、访问控制

零遥测、容器沙箱、命令审批、授权白名单

各有所长

团队协作

Per-assistant隔离、共享团队上下文

主要面向个人,子Agent并行

🦞 OpenClaw

跨平台迁移

内建 hermes claw migrate,一键导入OpenClaw配置

🧠 Hermes

三个关键差异

差异一:记忆 = 最大的分水岭

OpenClaw的记忆是基于文件的——你手动编辑SOUL.md和记忆文件,Agent读取它们。好处是直观、可控;问题是不会自动积累经验。跑同一类任务一百次,Agent并不会变强。

Hermes的记忆是活的。三层架构让它既有始终在上下文里的核心信息,又有按需调取的历史会话搜索,还有自动沉淀的技能文档。用得越久,Agent越聪明——这是OpenClaw目前做不到的。

差异二:安全记录

2026年3月,OpenClaw被曝出严重安全漏洞(CVE-2026-25253),攻击者可通过提示词注入远程执行代码。虽然团队快速修复,但对重视安全的用户来说是一个信号。

Hermes从设计之初就把安全放在核心位置:零遥测(不收集任何用户数据)、容器沙箱隔离、命令执行审批机制。

差异三:从OpenClaw迁移到Hermes有多简单?

Hermes内建了一键迁移命令:

hermes claw migrate

自动导入你的SOUL.md、记忆文件、技能、API Key、消息平台配置和命令白名单。说明Hermes团队对自己的定位非常清晰:吃掉OpenClaw的存量用户。

选谁?一句话建议:

  • 你要一个团队共用的AI助手,渠道覆盖越全越好 → OpenClaw

  • 你要一个能持续进化的个人AI,越用越强,重视安全和模型自由 → Hermes Agent

  • 你在OpenClaw上用了很久但发现它"学不会东西" → 直接 hermes claw migrate 过来

六、Hermes vs 其他方案:到底选谁?

维度

Hermes Agent

Claude Code

AutoGPT

LangChain Agent

定位

通用自主Agent

IDE编码Agent

实验性自主Agent

Agent开发框架

开源协议

MIT(完全开放)

商业订阅

MIT

MIT

模型支持

200+(任意切换)

仅Claude

取决于配置

取决于配置

记忆系统

三层持久化

CLAUDE.md规则

有限

需自行实现

通讯平台

15+平台网关

终端为主

Web界面

无内建

自学习

自动技能生成

自部署

支持

云端

支持

支持

上手难度

低(一键安装)

高(需开发)

简单总结:

  • 你主要写代码、用VS Code → Claude Code更合适

  • 你想搞一个能自学、能跨平台、能长期运行的个人AI助手 → Hermes

  • 你是开发者想构建自己的Agent → LangChain / Autogen

  • 你只想快速体验AI Agent → Hermes的一键安装最省事

七、实战场景举例

场景1:个人内容工厂

配置Hermes每天早上9点自动抓取行业新闻,生成摘要,推送到你的Telegram。用久了它会学习你关注的领域和写风格格,摘要质量越来越高。

场景2:全栈开发助手

在Telegram里说"帮我写一个FastAPI用户认证模块,要JWT + OAuth2",Hermes直接在服务器上创建项目、写代码、跑测试,完成后把结果发给你。

场景3:智能家居中枢

接入Home Assistant,你发消息说"回家了",Hermes帮你开灯、调温度、播放音乐。

场景4:团队协作Agent

把Hermes加进Slack团队频道,它自动参与讨论,回答技术问题,帮你查代码、查文档、查部署状态。

八、一些要注意的坑

  • 原生不支持Windows。必须用WSL2。这不是大问题,但Windows用户需要多一步。

  • 模型选择很关键。Hermes的工具调用能力取决于底层模型。建议用Claude Opus / Sonnet、GPT-4o,或者Nous自己的模型。便宜的模型可能工具调用不稳定。

  • Token消耗要注意。开启记忆系统和技能加载后,每次对话的token会增加。建议配好prompt caching。

  • 安全配置别跳过。Hermes能执行终端命令、操作文件,一定要配置好命令审批和授权白名单,特别是对外暴露的场景。

九、总结

Hermes Agent的核心价值不是"又一个AI聊天工具",而是它真正解决了AI助手的三个痛点:

🧠 记忆 → 三层架构让它真正"记住"你 📈 学习 → 技能自动生成让它越用越强 🔗 连接 → 15+平台让你随时随地可用

如果你是一个技术用户,想要一个能长期运行、持续进化的AI助手,而不是每次打开网页从零开始——Hermes值得试一试。

十、相关链接

官方GitHub地址:https://github.com/NousResearch/hermes-agent

https://github.com/NousResearch/hermes-agent

官方文档:

https://hermes-agent.nousresearch.com/docs/

评论交流

文章目录