拆解 Hermes Agent:6个子系统如何实现“越用越聪明“的自进化架构

张开发
2026/4/11 21:12:29 15 分钟阅读

分享文章

拆解 Hermes Agent:6个子系统如何实现“越用越聪明“的自进化架构
最近 AI Agent 赛道卷得飞起各种下一代架构满天飞。但说实话大多数都是在已有框架上套壳真正从记忆、学习、技能积累三个维度重构的Hermes 是我目前看到思路最完整的一个。今天不吹不黑咱们掰开揉碎聊聊它到底是怎么做的。3句话结论版 Hermes 的核心突破是把记忆从锦上添花变成了架构刚需不是靠更大的上下文窗口而是靠跨会话持久化和主动学习机制让 Agent 真正能记住。6个子系统各司其职从主动触发学习到后台异步复盘从双文件存储到向量检索形成了一套完整的自进化闭环不是东拼西凑的玩具。最让我服气的一点它居然把自训练也做进去了——对话轨迹直接回流成微调数据模型越跑越好这对工程能力要求极高一般团队真抄不来。第一部分自进化 vs 传统 Agent——到底有什么区别一句话结论传统 Agent 是金鱼型Hermes 是学习型说实话现在市面上大多数 Agent 方案本质上就是个增强版 RAG——接个向量库召回几段上下文塞进 prompt 里完事。每次对话都是从零开始没有任何积累。卷卷点评这就好比你每天上班同事都失忆了你得从头解释我是谁、我负责什么、上次说到哪了——累不累效率能高吗Hermes 想解决的就是这个问题。它追求的是三个核心能力持久记忆这次对话学到的知识下次会话还能用主动学习Agent 自己判断啥信息值得记住不是被动等用户说帮我存一下技能积累重复操作被抽象成可复用的技能下次同类任务直接调用这三条看起来简单但要同时做到工程上要翻过的山可不少。下面咱们逐个子系统拆解。第二部分6个子系统详解周期性 Nudge——该学习了的闹钟一句话结论不是用户提醒 Agent 学习而是 Agent 自己被系统催着学习Nudge 的设计思路很朴素每执行 10 个 turn系统就自动给 Agent 发一条该学习了的信号。这背后的逻辑是用户在对话过程中产生的隐式知识比如反复修改某个需求、某个解释方式特别有效、用户对某类问题特别敏感——这些信息如果不主动触发Agent 是不会自己想起来要记的。卷卷点评老卷觉得这个设计最妙的地方在于——它把学习从用户的负担变成了 Agent 的本能。你不用专门说帮我记住这个系统会提醒它该整理了。这才叫真正的主动学习。技术实现上Nudge 只是一个轻量的触发信号真正的学习逻辑由其他子系统完成主要是 Background Review 和双文件存储。后台 Background Review——不阻塞主进程的异步复盘一句话结论复盘在后台 fork 独立 Agent 做主流程完全不受影响这是 Hermes 工程上最亮眼的设计之一。传统的实现方式Agent 每次对话结束立即开始做复盘、总结、存入记忆。这个过程是同步的——用户在那等着Agent 在后台吭哧吭哧整理。问题来了复盘本身是重计算如果用户在短时间内发来新消息主进程就会被阻塞体验极差。Hermes 的做法是fork 一个独立的 Agent 专门做 Background Review以 daemon 线程的方式运行不阻塞主对话流程。用户发消息Agent 响应两不耽误。复盘结果通过进程间通信写回记忆系统。卷卷点评说实话这个架构对工程能力要求很高fork 进程、IPC、状态同步哪一个处理不好都是坑。但一旦跑通体验确实是质的飞跃。这也是为什么老卷一直说——Agent 的竞争归根结底是工程能力的竞争不是算法刷榜。双文件存储 Frozen Snapshot——稳定可信的记忆载体一句话结论MEMORY.md 和 USER.md 是长期记忆Frozen Snapshot 保证每次启动都有一致的环境 *Hermes 的记忆文件设计很有意思它采用了双文件 Snapshot的组合MEMORY.mdAgent 的自我认知、已学习的知识、偏好、习惯——跨会话持久化USER.md用户的身份信息、沟通风格、重要上下文——同样是持久化存储Frozen Snapshot这是 Hermes 的独创——每次会话启动时系统会生成一个不可变的 Snapshot包含当时的所有上下文。这个 Snapshot 有个关键作用稳定 prompt cache。为什么 Frozen Snapshot 这么重要因为大模型的 prompt cache 对输入长度敏感如果每次启动时上下文长度不一样cache 命中率极低。有了 Frozen Snapshot同样的角色配置每次启动的 token 序列是一致的cache 命中率大幅提升。卷卷点评老卷第一次看到这个设计时第一反应是——这个团队是真的在抠成本。prompt cache 优化做好了推理成本能降一大截。但大多数 Agent 团队压根不重视这个只顾着卷模型参数。Hermes 在工程细节上的投入能看出是做生产级系统的思路。自主技能创建——从经验中孵化新能力一句话结论Agent 不只记忆知识还能把重复操作封装成可复用的技能 *这是 Hermes 自进化能力的核心体现之一。系统提供了create_skill工具集Agent 可以将成功执行过的操作流程封装为一个新的技能Skill。这个技能是原子化写入的并且支持回滚机制——如果新技能有问题可以一键回退到之前的状态。技能创建的基本流程Agent 检测到某类任务被重复执行识别出可复用的操作模式调用create_skill工具生成结构化的技能定义写入技能库后续同类任务直接调用卷卷点评这个设计其实很接近人类的学习方式——从这件事怎么做到这类事都可以这么做。但老卷要泼一盆冷水技能创建的前提是操作可枚举。如果你的场景是高度多样化、低重复性的这个机制的价值会大打折扣。所以不是所有 Agent 都适合抄这个要看业务特点。MemoryManager 编排层——统一接口的记忆中台一句话结论不管底层用啥 memory provider对 Agent 来说接口是统一的 *现在市面上 memory provider 多了去了——向量库、KV 存储、图数据库甚至文件系统。问题是如果 Agent 直接依赖某个具体实现未来换 provider 的成本极高。Hermes 的 MemoryManager 做的就是编排层的活儿对上提供统一的 CRUD 接口给 Agent对下支持多种 memory provider 的插拔这样设计的最大好处是架构灵活性。今天用 Pinecone明天想换 Weaviate换 MemoryManager 里的 adapter 就完了Agent 代码不用动。卷卷点评老卷见过太多系统因为耦合了具体实现后期想升级技术栈时进退两难。MemoryManager 这个设计思路其实也是微服务里常说的接口抽象原则——值得所有 Agent 开发者借鉴。Holographic Memory Plugin——向量 信任评分的智能记忆一句话结论记忆不只存进去还能根据信任评分动态调整检索权重这是 Hermes 记忆系统里最重的一个子系统也是技术含量最高的。它的核心组成SQLite FTS5高效的全文索引支持模糊匹配HRR 向量检索Holographic Reconstructive Retrieval一种能捕捉记忆片段间潜在关联的向量方法不是简单的相似度召回信任评分反馈循环每条记忆有一个信任分随着使用情况动态调整——被频繁使用且验证准确的记忆信任分高长期没被使用或被证明有误的记忆信任分降低召回时权重下降这个反馈循环的意义在于记忆系统能自己长记性知道哪些该优先召回哪些该淘汰。卷卷点评老卷必须说这个子系统的实现难度是6个里最高的特别是 HRR 向量和信任评分机制。如果没有足够的研发投入做出来的基本上就是个四不像。但一旦跑通对 Agent 回答质量的影响是决定性的——不是所有问题都要靠大模型硬想记忆召回做好了很多问题在 context 里就有答案。第三部分Trajectory 自训练闭环——越跑越好的秘密一句话结论对话轨迹直接回流成微调数据模型在实战中持续进化这是 Hermes 最让我眼前一亮的设计也是它和其他 Agent 框架拉开代差的核心。它是怎么工作的传统的 Agent 迭代模式人工收集 bad case标注数据重新训练模型部署上线这个循环太慢了而且严重依赖人工介入。Hermes 的 Trajectory 自训练闭环是关键点在于自动筛选不是所有对话都值得回流成训练数据Hermes 会根据轨迹质量任务完成度、用户反馈、异常率等指标自动过滤只有高质量轨迹才会进入微调 pipeline。为什么说这很牛数据飞轮每轮对话都在给模型喂真实场景数据越跑越懂你的业务闭环自动性整个流程可以做到高度自动化人工标注的压力大幅降低效果真实提升不是靠人工规则打补丁而是让模型真正从实战中学习卷卷点评老卷说句实在话这个闭环做得好的团队放眼全球也不超过一只手。能做和敢做是两码事——敢做的前提是你对自己的数据质量和评测体系有足够的信心。大多数团队连评测集都做不好更别说自训练闭环了。这不是架构问题是工程体系成熟度的问题。第四部分四层记忆的工程权衡一句话结论不是堆技术是看场景选组合Hermes 的记忆系统实际上是四层的每层解决的问题不同成本也不同层次存储方式速度容量适用场景L1Frozen Snapshot最快Cache hit极小会话启动时的初始化上下文L2MEMORY.md / USER.md快文件读取小长期身份认知、用户偏好L3Holographic Memory (SQLiteFTS5向量)中检索开销中可检索的事实性知识L4外部知识库 / API慢网络开销大领域知识、实时数据卷卷点评这个分层设计本质上是在做成本-收益权衡。L1 最快但最贵依赖 cache容量有限L4 最便宜但最慢要走网络。很多团队的问题是——把所有东西都往 L3/L4 扔cache 利用率极低推理成本居高不下。老卷建议所有 Agent 开发者好好审视自己的记忆分层真的用对了吗结尾Hermes 带给行业的三点启示 金句收尾Agent 的进化不是靠更大的模型而是靠更聪明的记忆和学习机制。三点行业意义记忆即架构Hermes 证明了记忆系统不是锦上添花而是 Agent 能力的核心基座。未来 Agent 的竞争记忆系统是必争之地。工程能力决定上限6个子系统里每一个拎出来都是工程难题。算法决定下限工程决定上限——这是 Hermes 最好的注脚。自训练闭环是护城河Trajectory 自训练一旦跑通积累的数据和模型迭代优势会形成壁垒。后来者想追赶不只是抄架构还得重新爬一遍数据飞轮。卷卷最后的思考看完 Hermes 的设计老卷最大的感受是——它在用做产品的思路做技术架构。每一个子系统都回答了一个具体问题用户痛点是什么工程上怎么解解法之间怎么协同这种思路值得所有 AI Agent 开发者学习。别一上来就我们要做一个 AGI先想清楚——你的 Agent 怎么记住、怎么学习、怎么进化。这三个问题回答清楚了架构自然就出来了。如果你对 Hermes 的某个子系统想深入聊或者想了解具体某个技术的实现细节欢迎留言。

更多文章