零信任无法完全解决 Agentic AI 问题：推理层的安全空白需要 Agent 感知架构

核心论点

安全专家 Harmeet Singh 在 HackerNoon 上发表分析文章，提出了一个正在被越来越多安全从业者认同的观点：零信任架构（Zero Trust）正在接近但不能完全解决 Agentic AI 带来的安全问题。

这不是零信任”错了”——零信任在设计之初就没有考虑过 AI Agent 的存在。

零信任架构的核心假设是：没有人可以默认被信任，每一次访问都必须验证。

在传统的 IT 架构中，这意味着：

这些机制对于解决”谁可以访问什么数据”的问题非常有效。它假设访问主体是人类用户，访问客体是数据和资源，交互模式是请求-响应。

AI Agent 的行动模式与传统架构有根本性不同：

具体风险场景

提示注入（Prompt Injection）：恶意指令嵌入在 Agent 要处理的文档/邮件/网页中，劫持 Agent 的推理层。零信任架构完全没有”推理层”的概念，无法验证指令的合法性——它只能验证访问者的身份，无法验证指令的意图。
工具滥用与 Scope Creep：Agent 的工具权限通常是二元的（有或没有）。零信任可以控制”Agent 是否有权调用数据库 API”，但无法判断”这次数据库调用是否在上下文中合理”。
越权链（Privilege Escalation Through Chaining）：在多 Agent 系统中，Agent A 调用工具 1，Agent B 调用工具 2，两者各自的权限单独看都没问题，但组合操作可能产生未被预期的复合权限。
审计断层（Audit Trail Gaps）：现有日志只记录”做了什么”，很少记录”为什么决定这么做”。但当发生安全事件时，”Agent 当时的推理上下文”往往是最关键的证据。

作者提出了在零信任基础上补充 Agent 特定能力的框架：

补充能力	说明
最小权限扩展	不仅控制数据访问，还要控制行动（Actions）
上下文相关边界	类似 WAF 但应用于 Agent 的请求层——判断”这次操作在上下文中是否合理”
推理透明度	强制 Agent 输出决策理由，纳入审计链
人工审核检查点	高风险操作需要人类确认环
行为基线异常检测	学习 Agent 的正常行为模式，检测偏离基线的异常