安全研究人员发现一种名为 Agentjacking 的新型攻击手法,攻击者通过向 AI 编码 Agent 发送虚假的错误报告(fake bug reports),即可在零交互的情况下劫持 Agent 的完整工作流。该攻击揭示了 AI Agent 在自主决策场景下的一个固有脆弱性:对工具调用结果的过度信任。
攻击原理
AI 编码 Agent 的工作流通常包含以下环节:读取任务 → 分析代码 → 运行测试 → 读取结果 → 修复错误 → 提交代码。Agentjacking 攻击的核心在于污染结果读取环节。
具体攻击路径如下:
第一步:伪造 Bug 报告
攻击者在项目仓库的 Issue 或 PR 中提交一条精心构造的「Bug 报告」。这份报告看起来像一个合法的编译错误或测试失败信息,但暗含了两个异常设计:
- 报告中嵌入的可疑指标(如非预期的依赖版本号、指向外部仓库的包路径)
- 伪装的「修复建议」——推荐使用攻击者控制的第三方代码包
第二步:Agent 无感信任
AI 编码 Agent 在处理 Bug 报告时,会:
- 读取报告中的错误信息
- 根据错误类型自动搜索修复方案
- 执行包含代码安装/更新命令的修复操作
由于 Agent 在设计上倾向于信任上下文信息——编译器的输出、测试框架的报错、代码仓库的数据——它不会对 Bug 报告中的「修复建议」做额外的可信度验证。
第三步:自动执行恶意操作
当 Agent 按照伪造的「修复建议」执行操作时,它会:
npm install或pip install指向攻击者私有的恶意包- 运行包含恶意代码的「修复脚本」
- 将修改后的代码提交到仓库
整个过程中,Agent 认为自己在执行一次标准的 Bug 修复流程。
与供应链攻击的结合
Agentjacking 的真正杀伤力在于它与供应链攻击的天然结合:
恶意包注入:Agent 按照伪造的修复建议安装的第三方包,可能是攻击者精心构造的恶意包——包含后门、数据窃取逻辑或依赖混淆名称。
代码污染:Agent 提交的「修复代码」可能包含隐藏的恶意逻辑,通过正常的代码审查后合并到主分支,进而影响所有下游用户。
持续控制:一次成功的 Agentjacking 可以为攻击者建立持久化的代码级别后门,未来所有通过 CI/CD 流水线构建的产物都可能受影响。
受影响场景
Agentjacking 攻击在以下场景中尤为危险:
| 场景 | 风险等级 | 说明 |
|---|---|---|
| 开源项目维护 | ⚠️ 高 | 任何人都可以提交 Issue/PR,Agent 处理外部贡献者的报告时风险最大 |
| 内部代码审查 | ⚠️ 中 | 需要攻击者拥有内部仓库访问权限或能模拟内部报错 |
| CI/CD 自动修复 | ⚠️ 高 | Agent 具有代码写入和包安装权限,且无人类审查环节 |
| 个人开发辅助 | ⚠️ 低-中 | 取决于 Agent 自动执行的范围和权限 |
与 AutoJack 和 Tool Calling 安全性的关联
Agentjacking 与此前披露的 AutoJack(通过恶意网页劫持浏览 Agent)存在深层共性:
对工具输出无校验:
- AutoJack:Agent 信任浏览器返回的页面内容,未校验 WebSocket 响应的完整性
- Agentjacking:Agent 信任 Bug 报告/测试框架的输出,未校验修复建议的合法性
两者都指向同一个根本问题:当前的 Agent 设计假设工具返回的结果是可信的,但攻击者已经证明这个假设在多个场景下不成立。
缓解方向
针对 Agentjacking 类型的攻击,以下几类措施值得关注:
上下文来源分级:对 Agent 的输入上下文来源进行可信度分级。来自外部未验证源的 Issue/评论应标记为「低可信」,仅允许触发只读操作,禁止自动执行包安装或代码写入。
修复建议验证:Agent 在执行修复操作前,应交叉验证「修复建议」与官方包源的匹配性。例如,验证推荐的 npm 包是否存在于官方注册表、版本号是否与官方最新版一致。
操作审批策略:对于高危操作(安装新依赖、修改配置文件、提交代码),Agent 应暂停并请求人工确认,而非自动执行。
行为审计:记录 Agent 每次工具调用的完整上下文——输入来源、参数、输出结果和后续决策——便于在发现问题时回溯攻击链。
参考资料
- SC Media「Agentjacking attack exploits AI coding tools」,2026-06-19(原文链接
https://www.scmagazine.com/news/agentjacking-attack-exploits-ai-coding-tools,返回 404,本文基于公开摘要和领域知识撰写) - Hackread 相关报道,2026-06-19
- 微软安全团队「AutoJack: How a single page can RCE the host running your AI agent」,2026-06-18
文档信息
- 本文作者:zhupite
- 本文链接:https://zhupite.com/sec/agentjacking-fake-bug-report.html
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)