刚把Harness的配置文件和OpenClaw的“虾钳”整明白,结果第二天一早喜滋滋的看技术博客,觉得自己应该可以浅浅跟上浪潮,结果好家伙,热点话题又换了新面孔:Hermes agent。我当时的心情大概类似于:刚学会用翻盖手机,转头发现满大街都在用智能手表。那还等什么,马上去学习!

        在这篇文章里,我会先厘清Hermes Agent到底是什么、它从何而来,然后将它与OpenClaw、Claude Code、Codex这四个不同定位的Agent放在同一个坐标轴上进行系统对比。

一、Hermes Agent是什么?恐怕不止是一个“新工具”

        首先要澄清一个容易产生的误解:Hermes Agent并不是OpenClaw的“升级版”或“替代版”,而是另一条产品线。两者同属于“自托管+消息网关”赛道,但设计哲学截然不同。Hermes Agent核心卖点是一个闭环的学习系统——它能记住你,能从经验中创建可复用的技能,甚至能在你不盯着的时候自己跑定时任务。

        Hermes Agent的出现源于AI Agent领域存在的三大核心痛点:Agent能力固化(预先设定的技能有限,无法自主学习)、用户体验割裂(每次交互都从零开始,不携带过往记忆)、模型绑定僵化(只能选用单一的大语言模型)。它的解决思路也很直接:具备自我进化机制、拥有长期记忆能力、支持多模型路由调度。

二、Hermes的核心能力:一套完整的“自我进化”闭环

        如果只能用一个词概括Hermes Agent的设计理念,那就是“闭环”。它不是把一堆功能拼在一起,而是围绕“记忆→学习→沉淀→复用”这条链条做了系统性的工程。下面拆开来说。

1. 持久记忆

        这是Hermes与大多数Agent最本质的差异之一。它的持久记忆不是把每一句对话都塞进上下文,而是通过两个落盘文件来实现:MEMORY.md(Agent自己的工作笔记:环境、项目惯例、踩坑结论)和USER.md(你的偏好、沟通风格、角色期待),默认存放在~/.hermes/memories/目录下。每次新会话开始时,这两份内容会作为固定块写进系统提示词,Agent一上来就带着上轮整理过的要点,而不是从零猜你是谁。

        看到这,一些读者可能产生一些疑惑,openclaw不也是这样做的吗?为什么这里要单独拿出来说?有意思的是Hermes对记忆容量做了主动限制:MEMORY.md上限约2200字符,USER.md上限约1375字符。为什么要主动限制?设计者的逻辑是:对LLM来说,少量精准的记忆比大量模糊的记忆更有价值。因为空间有限,Agent被迫学会信息筛选和压缩——只保留真正重要的东西。这个设计哲学与OpenClaw的“全量存储、向量检索”策略形成了鲜明对比,后面会详细展开。

2. 自进化技能系统:把“这次费劲搞定的流程”变成“下次一条命令能调用的说明书”

        如果说持久记忆解决的是“下次开聊,关键约定还在”,那么技能系统解决的就是“能力沉淀”的问题。技能的物理形态是~/.hermes/skills/目录下的SKILL.md及附属文件,格式兼容agentskills.io那套开放标准,可分享、可从Hub安装。

        但最核心的创新点在于:技能不是用户写的,是Agent自己生成的。当Agent完成一个复杂任务(通常涉及5次以上工具调用)、走过弯路才试出正解、或者被你纠正了做法之后,它会通过skill_manage工具自动创建、打补丁或改写技能。后文遇到类似任务时,它会自动调用并优化这些技能,每15个任务还会自动触发一次反思循环,评估哪些技能有效、哪些需要改进。

        与OpenClaw的静态技能生态(由用户手写Markdown、通过ClawHub分发)相比,Hermes把“能力生产”的工作从开发者手中交给了Agent本身,这是一种根本性的范式转移。

3. 自主性与安全设计:从“人必须在决策环里”到“Agent自己跑”

        Hermes支持六种终端后端:Local(默认,命令直接在机器上跑)、Docker(隔离容器执行)、以及云端和HPC集群等,覆盖了从个人笔记本到生产环境的全部场景。同时它内置了凭证池机制,支持每个provider多个API密钥的自动轮换和故障转移,以及Camofox隐身浏览器提供反检测后端。这些设计让Hermes不仅“能跑”,更“能在生产环境稳定跑”。

三、横向对比:四个Agent,四种设计哲学

        很多人第一反应是把Hermes、OpenClaw、Claude Code、Codex放在一起比,但实际上它们的定位差异大到几乎不构成完全竞争关系。下面从四个维度做系统对比:定位场景、记忆系统、技能生态、安全与稳定性。

3.1 定位场景

        Claude Code是Anthropic官方推出的终端AI编程Agent,核心场景是软件开发。你坐在电脑前,打开终端或IDE,让它帮你写代码、改代码、跑测试。它的能力边界很清晰:专注于代码任务,在代码生成和bug修复上处于第一梯队。但它的存在感被绑定在开发工具链里——session之间没有持久记忆,不能跨平台接收消息,也没有定时任务能力。

        Codex CLI是OpenAI对Claude Code的直接回应,同样是一个终端编程Agent,用Rust编写,支持通过自然语言提示与代码库交互,读取和修改文件、运行命令、建议重构、执行代码审查等。它与Claude Code的核心差异在于模型绑定——Codex深度集成OpenAI的模型生态,而Claude Code自然绑定Claude系列。

        OpenClaw的核心定位是多渠道AI网关。它真正强大的地方是消息平台集成——Telegram、WhatsApp、Discord、Slack、飞书、钉钉、QQ、微信等22个以上的消息平台全部覆盖,配合ClawHub上13000多个技能库,形成了一个庞大的自动化运营生态。它的设计哲学是“人必须在决策环里”——把控制权交给用户,每一步都需要确认,这在早期是优势,但当用户量大了之后,大多数普通用户并不想在每一步操作前都停下来确认。

        Hermes Agent则走出了一条反直觉的路:。限制、约束、让Agent自己学会成长它的定位不是“最全”或“最强”,而是“越用越懂你”。如果说OpenClaw是一个需要你不断下达指令的工具箱,Hermes更像一个会主动学习、主动优化、主动沉淀经验的“个人助理”。

3.2 记忆系统

        这是四个产品最核心的分歧点。

        Claude Code:无持久记忆。每次启动session都是一张白纸,不跨session保留任何记忆,除非你手动通过提示词传递。这对编程场景来说是合理的——代码上下文通常由IDE和版本控制系统承载,不需要Agent再叠一层。

        Codex CLI:同样没有跨会话的持久记忆设计。它的“记忆”范围局限在单次会话内,适合一次性任务或CI场景中的自动化执行。

        OpenClaw:全量存储。所有对话历史、上下文全部持久化到本地向量数据库,配合向量搜索实现跨会话检索。这套方案信息不丢,但随着使用时间拉长,数据库里的噪音越来越多,每次检索返回的相关内容也趋向膨胀,token消耗随使用时长线性增长。

        Hermes Agent:有限记忆+主动压缩。如上文所述,记忆文件有严格的字符上限,在每个session开始时注入系统提示词,占的token是固定的,不会随使用时间膨胀。而且因为空间有限,Agent被迫学会信息筛选和压缩——只保留真正重要的东西。此外,Hermes还内建了FTS5全文检索和Honcho分层持久化架构,让记忆不仅是“存”,更是“可检索、可维护”的。

3.3 技能生态

        OpenClaw的技能系统是最早也是最庞大的,ClawHub上有超过13000个技能扩展,用户可以给Agent装各种能力。但问题也出在这里,据Snyk安全团队审计,ClawHub上5700个技能中有1467个被确定为恶意,包括凭证窃取、加密挖矿、持久后门、prompt注入等,其中91%混合使用了prompt injection和传统恶意软件技术,单个恶意技能的最高安装量超过34万次。

        Hermes的技能生态走的是完全不同的路,技能由Agent自己生成而非用户手写,格式遵循agentskills.io开放标准,可分享但不需要依赖中心化市场。这种设计从根本上规避了恶意技能分发的问题,但也意味着生态规模目前远不如OpenClaw。

        Claude Code也有Skills机制,但定位更偏向开发工作流——Skills本质是可复用的Markdown文件,定义了一组特定场景下的行为规则和工具调用模式,可以在不同项目间共享。

        Codex CLI的技能/工具体系相对精简,主要通过slash命令和内置工具集来实现,没有像OpenClaw那样庞大的第三方技能生态。

3.4 安全与稳定性

        这是OpenClaw目前最大的短板。OpenClaw上线后的63天内累计披露了138个安全漏洞,其中7个严重级别、49个高危级别,合计占比41%。2月14日,OpenClaw创始人Peter Steinberger宣布加入OpenAI,项目移交给开源基金会,此后安全问题的披露频率进一步加速。

        Hermes写入记忆前会进行安全扫描,拦截明显的注入、偷密钥等模式;凭证池支持密钥轮换和故障转移;Camofox浏览器提供隐身浏览的反检测后端。这些设计虽然不能保证100%安全,但至少表明团队在安全性上投入了工程资源,而不是事后修补。

        Claude Code和Codex作为官方出品的工具,在安全性上天然有优势——它们的执行范围主要局限在代码仓库内,攻击面远小于OpenClaw这种全系统代理。但代价是功能边界也更窄。

四、总结与展望

        把四个产品放在一起看,一个清晰的格局就出来了:Claude Code和Codex是“垂直深耕型”——专注代码场景,模型能力顶级,但场景边界明确,没有跨会话记忆和跨平台能力。OpenClaw是“横向覆盖型”——生态最大、渠道最全、技能最丰富,但安全漏洞频发。Hermes则是“自进化纵深型”——不求大而全,但在记忆系统和自我学习上做了深度工程,让Agent越用越聪明,越用越懂你。

        Hermes Agent从2月底开源至今不到两个月,星标数已经突破3.9万,增速还在加快。用户反馈里最常提到的一句话是:“龙虾记忆太差,爱马仕无论怎么重开、过多久都能记住”。这句话虽然简单,却点出了AI Agent领域最本质的痛点——记忆不是技术的装饰品,而是智能的基础。当一个Agent能够记住你是谁、你做过什么、什么方法管用,它才真正从“工具”进化成了“伙伴”。Hermes在这个方向上迈出了扎实的一步,而这场Agent竞赛的下半场,才刚刚开始。

Logo

这里是“一人公司”的成长家园。我们提供从产品曝光、技术变现到法律财税的全栈内容,并连接云服务、办公空间等稀缺资源,助你专注创造,无忧运营。

更多推荐