2026 年 6 月 17 日,Jack(BuilderOS)在 YouTube 上发布了一期非常系统的 Hermes Agent 教程——“Every Level of Hermes Agent Explained”。这期约 25 分钟的视频,并不是简单的功能介绍,而是从能力成长的角度,把 Hermes Agent 的使用者分成了 7 个清晰的层级。
每个层级都有专属的工具箱、时间节省量,以及应该避免的常见错误。这比单纯的”功能清单”有用得多——你不需要一步登天,而是可以对照自己的现状,找到下一阶段该往哪个方向走。
以下是对视频核心内容的整理和解读。
核心框架预览
| 层级 | 名称 | 核心能力 | 时间节省 | 关键工具 |
|---|---|---|---|---|
| Level 1 | 初学者 | 安装即用,一次性提示 | ~30 分钟/天 | 基础安装 + 消息平台 |
| Level 2 | 学徒 | 记忆系统 + 个性化配置 | ~5 小时/周 | Soul.md + 会话记忆 |
| Level 3 | 技能使用者 | 技能系统 + 模型切换 | ~1 天/周 | /steer 命令、多模型路由、Skills |
| Level 4 | 整合者 | MCP 集成外部工具 | 数倍效率提升 | MCP 服务器、API 对接 |
| Level 5 | 编排者 | 多代理并行编排 | 指数级增长 | Sub-agent、模型池 |
| Level 6 | 建造者 | 定时任务 + 软件开发 | 异步工作 | Cron job、Codex 集成 |
| Level 7 | 高级用户 | 统一 AI 操作系统 | 全天候自动化 | BuilderOS 仪表盘、全链路集成 |
Level 1 — 初学者(Beginner)
从聊天机器人到代理(Agent)的第一步
这是最基础的层级。你下载了 Hermes Agent,连接到 Telegram(或其他消息平台),然后用一次性提示(One-shot Prompt) 让它帮你做事。
典型的场景:“我要从迪拜去欧洲旅行 3 个月,帮我研究一下最好的目的地,列个清单,存成 HTML 放到桌面。”
发送完后,Hermes 自主运行工具、上网搜索、生成文件,完成后通知你。你不需要守在屏幕前。
容易犯的错误:还是拿它当聊天机器人用,上来就对话而非委托任务。正确做法是提出明确的目标(Intention),让它去执行,然后迭代优化提示。
标志性能力:能利用工具调用(Tool Calling)自主完成单次任务。
时间节省:约 30 分钟/天。
Level 2 — 学徒(Apprentice)
让 Agent 真正了解你
到了这个层级,Hermes 不再是一个”谁用都一样”的工具,而是开始了解你这个人。
核心是两个系统:
- 记忆系统(Memory):Hermes 会自动记住对话历史中的关键信息,可以精确回忆几天前的对话内容。你不需要重复上下文。
- Soul.md:一个个性化配置文件,定义了你希望 Hermes 如何称呼你、你的业务目标、关键指标、习惯偏好等。两份不同的 Soul.md 面对同一个问题,会得到完全不同的回答。
这背后的核心理念是上下文工程(Context Engineering):Agent 越了解你,它的输出质量就越高。视频中强调了一个关键判断标准——如果两个人问 Hermes 同一个问题,应该得到截然不同的答案,那才算用对了这个层级。
时间节省:约 5 小时/周(省掉了大量的上下文重建时间 + 任务切换成本)。
Level 3 — 技能使用者(Skill User)
用命令和技能加速
这个层级开始深入 Hermes 的内置能力:
/steer命令:在发送任务的同时,给一个方向指引,引导 Agent 的思考方式。例如“研究 LinkedIn 获客策略” + steer “重点看 Top Creator 的方法”。/background命令:让一个任务在后台运行,同时继续处理当前对话。两个任务互不干扰。/handoff、/clear等流程控制指令。
更关键的是模型无关(Model Agnostic) 行为——不再用同一个模型干所有事,而是根据任务类型选择最合适的模型:
| 任务类型 | 推荐模型 | 理由 |
|---|---|---|
| 日常对话/轻量任务 | ChatGPT 5.5($20 订阅) | 便宜、够用 |
| 深度写作/分析 | Claude Opus 4.8 | 最智能,适合复杂推理 |
| 性价比之选 | Claude Sonnet 4.6 | 性能与成本的平衡点 |
| 网络/X 搜索 | Grok(X 订阅) | 访问 X 全量数据 |
| 低成本批量 | DeepSeek V4 Flash | 性价比极高 |
| 任意模型接入 | OpenRouter | 接入全球所有模型 |
Skills 系统在这个层级启用——你可以为特定任务编写技能(Skill),指定其模型、描述和系统提示。例如”竞品研究技能”绑定 DeepSeek(便宜),”合同审核技能”绑定 Opus(严谨)。
时间节省:约 1 天/周。这个说法来自视频——当你能同时跑多个后台任务、用最便宜的模型处理大部分工作、只把复杂任务交给顶级模型时,效率差异非常显著。
Level 4 — 整合者(Integrator)
把 Agent 接入你的真实世界
前三层都是 Agent 在 Hermes 内部工作。到了 Level 4,你开始把 Agent 连接到你的日常工作流——邮件、日历、Notion、Slack、ClickUp、CRM 等等。
实现方式:MCP(Model Context Protocol)服务器。Hermes 原生支持 MCP,你只需要提供 API Key 或 OAuth 登录,Agent 就能读取和操作这些外部系统。
视频中的生动例子:“想知道这周业务怎么样”——Hermes 会自己去 ClickUp 查任务进度、去 Slack 看团队更新、去邮箱查往来记录,然后给你一份完整的周报。你不需要手动收集信息。
容易犯的错误:接入太多 MCP 导致上下文膨胀。视频比喻为”给 5 岁孩子整个糖果店”——Agent 的上下文窗口有限,不需要的 MCP 反而拖慢性能。只接你真正用到的工具。
安全建议:可以先让 Agent 读取和草稿,但不给发送权限。视频作者提到邮箱目前只开放 Draft 和 Calendar 权限,暂不给 Send。
核心心法:“任何你在笔记本上做的事情,Hermes 都应该能做。如果它做不了,问自己为什么没给它这个权限。”
Level 5 — 编排者(Orchestrator)
Agent 管理 Agent——并行化你的产出
到了这个层级,Hermes 不再只是一个执行者,而是一个管理者,管理一群 Agent 协同工作。
你可以这样下达指令:“创建一个 Agent 团队。用 DeepSeek V4 做深度研究,研究卖网站给哪些行业最赚钱;用 ChatGPT 5.5 做批判审核;用 Opus 4.8 做总指挥,直到他们达成共识。”
关键能力:
- 多模型并行:同时启动多个 Sub-agent,每个用不同的模型
- 循环迭代:子代理可以互相评审、迭代,直到输出满意
- 模型池分配:把粗活交给便宜的模型,精活交给贵的模型
视频中特别澄清了一个常见问题——Claude Code vs Hermes 谁更好? 类比是”刘易斯·汉密尔顿 vs 法拉利”:Claude 和 ChatGPT 是赛车手(模型),Hermes 是赛车(系统)。系统让赛车手发挥最大能力。
时间节省:不再是线性增长,而是指数级——多个任务同时进行,且跨模型协作。
Level 6 — 建造者(Builder)
异步工作:Agent 在你离线时干活
Level 6 有两个核心能力:
1. 软件开发
Hermes 可以像 Claude Code 一样构建真正的软件。你可以跟它说:“帮我建一个 Instagram 异常值分析工具”,它会在后台完成编码。视频作者提到自己在健身房做卧推时,Hermes 在后台帮他完成了代码构建。
2. 定时任务(Cron Job)
这是异步化(Asynchronicity) 的关键——你不必在 Agent 工作时在线。你可以说:“周末有个重要会议,帮我做 24 小时深度研究,周五下午把报告放我桌上,附带一份邮件草稿。”
Hermes 会:
- 立即开始研究
- 在指定时间交付
- 你只收到最终结果,中间过程完全自主运行
时间节约的本质变化:从”我说你答”的同步模式,变成“我设定、你执行、我验收”的异步模式。事情在你没想它的时候就被完成了。
Level 7 — 高级用户(Power User)
统一 AI 操作系统
这是最高的层级。你在所有 AI 工具之间不再切换上下文,而是通过一个统一的仪表盘(Agentic Operating System)管理一切:
- 全品牌连接:Claude Code、Codex、Hermes 的编码产出集中一处
- 跨工具记忆:Obsidian 笔记、Hermes 会话、代码库记忆互相打通
- 花费追踪:所有模型的 API 花销概览,一眼看到各模型的成本
- 主动推理(Dream):Agent 会分析你所有的数据(对话、代码、笔记),主动找出”你在做什么、哪些可以优化”,生成改进建议推给你
- 全自动运行:定时任务、报告生成、策略洞察——全部在你睡觉时完成
“你不可能真正同时运行 1000 个 Agent,但你可以建立一套系统,让它以你为中心自动运转。”
三个你需要理解的真相
视频结尾提出了三点反思:
- Hermes 不是比 Claude Code 更好的编码工具——它只是在使用 Claude Code。Hermes 是系统的系统。
- 你不需要等 17 年——这些层级从 Level 1 到 Level 7,认真学只需要几天到几周。
- 真正的魔法不在工具,而在你如何用它——AI 是加速器,不是你该解决的问题本身。先想清楚你的瓶颈在哪,再用 AI 加速它。
我的解读
这期视频最大的价值不是”Hermes 有什么功能”,而是提供了一个能力进阶的坐标系。大多数用户停留在 Level 1-2 之间——知道自己该从聊天升级到代理模式,但还没建立完善的记忆和个性化体系。少数人到了 Level 3-4,开始用 Skills 和 MCP 扩展能力边界。
Level 5 以上是一个分水岭——从”个人助手”变成”团队引擎”。你对 Agent 的理解从”我问它答”升级到”我设定目标,它调动资源去执行”。
参考这个框架,你可以对照一下自己现在在哪个层级,然后找到下一个层级最有价值的那个工具去学。不需要一口气冲 Level 7,但也不该在 Level 1 待太久。
参考资料
- 视频:Every Level of Hermes Agent Explained — BuilderOS / Jack(2026-06-17)
- Hermes Agent 官方文档:https://hermes-agent.nousresearch.com/docs
- Hermes Agent GitHub:https://github.com/nousresearch/hermes-agent
文档信息
- 本文作者:zhupite
- 本文链接:https://zhupite.com/ai/hermes-agent-seven-levels.html
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)