AI 代理工具正快速迭代,但用户的痛点往往不是功能不够多,而是工具不够稳——今天能跑,明天就坏。Hermes Agent 近期的几次更新,正是在这个方向上做出了调整。本文梳理其核心功能变化,并与 OpenClaw 做横向比较。
OpenClaw 的主要问题
OpenClaw 的口碑近期出现明显回落,原因主要集中在两点:
更新破坏稳定性。 OpenClaw 更新频率较高,但每次更新都有可能影响现有的运行环境。对重度用户而言,一次意外的兼容性问题往往需要花费大量时间排查修复。
长期使用后性能下降。随着功能持续堆叠,系统整体性能开始出现明显衰减——卡顿、响应变慢、会话状态膨胀等问题逐渐浮现。这与其session 管理机制有关:随着使用时间增长,系统状态越来越重,最终影响实际可用性。
Hermes 的应对思路
与OpenClaw 的”频繁发布、大量新增”不同,Hermes 的更新节奏更为聚焦:每次发布有明确主题,功能之间保持连贯性,用户可以清楚知道本次更新解决了什么问题、工作流会发生哪些变化。
这种思路的核心判断是:在工具开始接管任务流的阶段,可靠性本身就是核心功能。
核心功能解析
1. Kanban 看板:任务管理的可视化中枢
Hermes 的 Dashboard 提供了一个可直接用于生产环境的看板界面。启动方式如下: 狂欢
hermes dashboard
看板按以下顺序流转任务状态:
分类 → 待办 → 就绪 → 进行中 → 阻塞 → 完成
与普通看板工具的区别在于,Hermes 的看板与记忆系统和代理团队深度集成。一张任务卡片不只是一行标题,而可以通过代理自动补全上下文、背景信息和执行路径。这使得多任务并行处理成为可能——不同卡片可由不同代理独立推进,而非在单一对话线程中排队等待。
自动化工作流配置
默认情况下,Hermes 的看板不会自动分派任务,需要结合cron 定时任务和额外代理实现自动化。一个典型的提示词配置如下:
“每10 分钟检查看板中Triage 列是否有新任务;如有,调取记忆库补全任务细节,将卡片移至Ready;再检查Ready 中是否有已分配代理的任务,如有则开始执行。”
实践中,建议将这类行政型轮询工作交给独立的专用代理(如Librarian),而不是让主代理周期性地中断其他工作去执行检查。这样做有两个好处:主代理专注度不受干扰;后台管理任务可运行在成本更低的模型上。
2. /goal 指令:面向长周期任务的目标委托
/goal是Hermes 针对复杂、长周期任务设计的指令模式。与普通的单次提示词不同,它允许用户给出一个高层目标,代理自行拆解步骤、规划流程并持续推进。 狂欢
hermes
/goal [你的目标描述]
使用建议:
/goal的效果高度依赖目标描述的质量。模糊的指令(如”帮我做一个游戏”)往往难以产出可用结果,因为代理缺乏边界、验收标准和资源约束等关键信息。- 推荐做法是先借助其他大模型(如Claude 或ChatGPT)将模糊需求转化为结构化的任务说明,再作为
/goal的输入。 - 对于持续时间较长的目标任务,建议分配给成本较低的模型或本地模型运行,以控制整体开销。
3. Profiles:独立的多代理体系
Hermes 支持创建多个相互独立的代理实例(Profile),每个代理拥有独立的记忆、技能集和环境变量,可承担不同职责。
这种设计解决的问题是:当一个代理同时处理开发、研究、写作、行政等多类工作时,其记忆会快速膨胀,进而影响判断质量和响应性能。将工作分配给多个专职代理后,每个代理只维护与自身任务相关的上下文,整体负担显著降低。
一个基础的多代理分工框架可参考如下:
| 代理角色 | 主要职责 |
|---|---|
| 主代理 | 对外沟通、任务调度 |
| 编码代理 | 开发与调试任务 |
| 研究代理 | 资料收集与分析 |
| Librarian(行政代理) | 看板管理、记忆整理、后台事务 |
4. Model Catalog:按任务类型分配模型
Hermes 提供可视化的模型目录,支持为不同任务类型指定不同模型。这一功能的实用价值在于成本控制:无需让最昂贵的模型处理所有工作。
一种典型的分配策略如下:
| 任务类型 | 推荐模型策略 | 原因 |
|---|---|---|
| 总控代理 / 复杂决策 | 能力较强的模型 | 需要高质量规划与判断 |
| 审批、MCP、常规执行 | 成本较低的模型 | 重复性高,不需要最高智能 |
| 长时间 /goal 任务 | 低成本或本地模型 | 任务周期长,成本敏感 |
| 后台定时轮询 | 最低成本模型 | 检查类任务无需强推理 |
5. Compression 与 Curator:长期稳定运行的保障机制
Compression(压缩机制)
Hermes 存在记忆压缩机制,但默认配置下压缩力度较强,可能导致代理在单次压缩后遗忘大量上下文,影响连续性任务的执行质量。
改善方法:在 Config → Compression 中将压缩阈值调整为 0.5。这会使压缩更频繁地发生,但每次处理的数据量更小,从而避免大规模的记忆损失。
需要指出的是,在记忆管理方面,Hermes 目前整体上仍弱于 OpenClaw,但调整阈值后体验会有明显改善。
Curator(技能修剪机制)
Curator 默认每 7 天运行一次,自动分析哪些技能近期被频繁使用、哪些长期闲置,并生成报告、清理冗余技能。
这一机制的意义在于:代理系统如果只增不减,随着时间推移必然变重变慢。定期的自动修剪相当于例行维护,可在 Config → Curator 中调整运行频率。
综合评估
Hermes 与 OpenClaw 代表了当前 AI 代理工具的两种发展取向:前者优先保障稳定性与可维护性,后者更激进地堆叠新能力。
对于将 AI 代理纳入日常生产流程的用户来说,Hermes 目前的组合——Kanban 看板、/goal 指令、多代理 Profiles、Model Catalog、Compression 调优与 Curator 自动修剪——构成了一套相对完整、可长期运行的工作框架。
其短板主要集中在记忆压缩机制上,仍有改进空间。但就整体成熟度而言,它已更接近一个可以进入生产环境的工具,而非仅供探索的实验品。




