6月11日,HackerOne 宣布推出其 Agentic AI 安全测试平台。消息不长,但冲击力不小——一个以”人海战术”闻名的漏洞赏金平台,开始用 AI Agent 来替代自己的核心生产力。
这不只是”又一款自动化扫描工具”。HackerOne 自己就是做安全测试的,它太清楚现有自动化工具的短板了——所以它做了一个有上下文感知能力的 Agent。
传统的自动化安全测试,到底差在哪
在说 HackerOne 的 Agent 之前,先看看传统自动化安全测试工具有什么不可逾越的瓶颈。
| 能力维度 | 传统自动化扫描器 | 人类安全研究员 |
|---|---|---|
| 覆盖广度 | 高 | 低 |
| 业务逻辑理解 | 无 | 强 |
| 多步骤漏洞 | 几乎不可能 | 擅长 |
| 误报率 | 高 | 低 |
| 可规模化 | 容易 | 极难 |
| 成本 | 低 | 高 |
传统扫描器最大的问题是没有上下文。它知道 /api/users/123 是个 API 端点,但它不知道 123 是当前用户的 ID 还是另一个用户的 ID,它不知道应该先登录、再创建资源、再尝试以另一个用户身份访问这个资源——而这种”多步骤业务逻辑绕过”正是 IDOR 和权限提升漏洞的核心。
人类安全研究员可以做到,但无法规模化。HackerOne 做了十年众测,最大的瓶颈也在这里。
HackerOne Agent 的技术架构推测
虽然没有拿到完整的白皮书,但从已知信息可以推断其架构:
人类安全专家定义 Scope
│
▼
┌──────────────────┐
│ Agent 控制器 │ ← 负责任务拆分和调度
└────────┬─────────┘
│
┌──────┴──────┐
▼ ▼
┌──────────┐ ┌──────────┐ ┌──────────┐
│ Recon │ │ Explore │ │ Exploit │
│ Agent │ │ Agent │ │ Agent │
│ │ │ │ │ │
│ 子域名扫描 │ │ 页面爬取 │ │ 尝试注入 │
│ 端口探测 │ │ 参数发现 │ │ 权限绕过 │
│ 技术指纹 │ │ 表单填写 │ │ 会话篡改 │
└──────────┘ └──────────┘ └──────────┘
│ │ │
└─────────┴──────────────┘
│
▼
┌──────────────────────────┐
│ 上下文融合引擎 │ ← Agent 间共享发现
│ "Session A 创建了资源 R" │ 形成攻击链知识
│ "Session B 可以访问 R" │
└──────────────────────────┘
│
▼
验证 + 生成报告
关键区别在于多 Agent 协作。一个 Agent 负责探索业务逻辑(”这个应用有一个”申请提现”功能,需要先注册用户、再绑定银行卡、再提交申请”),另一个 Agent 负责在每一步尝试绕过(”能不能用另一个用户的 session 提交这个申请?”),第三个 Agent 负责验证漏洞是否真实存在。
上下文感知能力——最硬的那部分
HackerOne 说他们的 Agent 能理解业务逻辑,这意味着至少有以下能力:
状态跟踪
Agent 必须理解应用的状态机。比如一个电商应用的结账流程:
加购 → 登录 → 填写地址 → 选择支付 → 确认订单 → 支付
Agent 需要在每一步之后维护应用的当前状态,并知道下一步合法的操作是什么。这听起来简单,但实际上对所有自动化安全工具来说都是最大的技术壁垒——因为应用的”状态”往往是隐式的(通过 Session/Cookie/Token 维护),不是显示的 API 契约。
多账户上下文
这是 IDOR 检测的关键。Agent 需要同时维护多个用户的上下文:
User A: 登录 → 创建订单 #ORD-001
User B: 登录 → 尝试访问 /api/orders/ORD-001
↓
如果成功 → 发现 IDOR 漏洞
传统扫描器做不到这一点,因为它们只用一个 session。
业务规则理解
更复杂的场景:Agent 需要理解”普通用户不能提现超过 5000 元”这样的业务规则,然后尝试绕过它——通过参数篡改、状态竞争、角色冒充等手段。
这需要 Agent 在交互过程中主动学习应用的业务规则,而不是依赖预设的检测规则。HackerOne 的 Agent 应该是基于 LLM 来推理业务逻辑的——它读页面文本、分析 API 返回的字段名、从错误消息推断校验逻辑。
对众测生态的影响
HackerOne 的这个动作很有意思——它同时在做两件看起来矛盾的事:
- 用 AI Agent 替代人工完成可重复的自动化安全测试
- 用众测社区覆盖 AI Agent 做不了的深度测试
这意味着 HackerOne 在重新定义众测的边界:
- AI Agent(自动化):覆盖 Web 应用扫描、API 安全测试、云配置检查——这些以前需要安全研究员花大量时间的重复性工作
- 众测社区(人工):专注于需要深度业务理解、社会工程、逻辑推理的复杂漏洞
这不叫替代,这叫分层。
对于企业的安全团队来说,这个分层其实更合理:
- 先用 HackerOne Agent 做7×24 的持续自动化安全测试
- Agent 发现不了的问题,再通过漏洞赏金计划引入人类研究员
成本也更可控:Agent 是固定订阅成本,众测是按效果付费。
这场竞赛已经开始了
HackerOne 不是唯一在做这件事的。看看这个赛道:
- Pentera:持续自动化安全验证,已经做了好几年 Agent-based 的攻击路径模拟
- X60 / 火线:国内众测平台也开始引入 AI 辅助漏洞发现
- ChaosDB / 各类 AI CTF 框架:学术界一直在推 AI 驱动的自动化漏洞发现
HackerOne 的优势在于它拥有全球最大的漏洞验证数据库——过去十年积累的数百万份经过验证的漏洞报告。这些数据可以用作 AI Agent 的训练材料,让 Agent 知道”什么样的发现才算真正的漏洞”。
HackerOne 这个 Agentic 平台可能不会立刻让安全研究员失业——但到明年这个时候,一个没有 AI Agent 辅助的渗透测试团队,可能会在效率和覆盖率上被有 Agent 的团队碾压。
这大概就是漏洞发现领域真正的范式转变——不是 AI 替代人,而是有 AI 的人替代没有 AI 的人。
文档信息
- 本文作者:zhupite
- 本文链接:https://zhupite.com/sec/hackerone-agentic-ai-security-platform.html
- 版权声明:自由转载-非商用-非衍生-保持署名(创意共享3.0许可证)