Anthropic 发布 Mythos 5 / Fable 5:前沿模型能力跃迁与安全治理的新平衡

2026/06/10 ai AI · Anthropic · Claude · Mythos 5 · Fable 5 · 前沿模型 4692 字 · 约 14 分钟 阅读 ...
Anthropic 发布 Claude Fable 5 和 Claude Mythos 5。Fable 5 登顶 Artificial Analysis 智能指数榜首(总分 64.9),在知识工作、Agent 编程、科研等多个维度刷新 SOTA。本文涵盖官方数据 + 独立第三方评测。

发生了什么?

2026 年 6 月 9 日,Anthropic 正式发布 Claude Fable 5Claude Mythos 5 两款新一代前沿模型。

两者底层是同一个模型,区别在于安全机制的开与关

模型定位安全策略适用对象
Claude Fable 5面向一般用户的 Mythos 级能力分类器拦截高风险领域,回退到 Opus 4.8所有用户(含 API、订阅计划)
Claude Mythos 5面向网络防御者的无限制版本解除网络安全等领域的限制Project Glasswing 合作伙伴及后续可信访问计划

定价:$10/M 输入 token,$50/M 输出 token——不到 Claude Mythos Preview 的一半。


能力升级的五个维度

1. 软件工程:月级的压缩为天数

Stripe 在早期测试中报告了一个惊人的结果:在 5000 万行 Ruby 代码库中,Fable 5 用一天完成了一次全代码库迁移——按之前的手工方式,整个团队需要两个多月。

在 Cognition 的 FrontierCode 评估(衡量模型能否在满足高质量生产代码标准的前提下通过困难的编码任务)中,Fable 5 在中等 effort 水平下的得分就超过了所有其他前沿模型。

2. 知识工作:金融分析、交易推理全线领先

在 Hebbia 的金融基准测试(面向高级分析推理)中,Fable 5 获得了最高分,在文档分析、图表解读和问题解决方面均有显著提升。

IMC 的评估更全面——Fable 5 几乎在所有交易分析维度上取得了优秀成绩,包括事实查询、概念推理、根因分析和期望值分析。

3. 视觉能力:从截图还原完整应用

Fable 5 在视觉任务上达到了新的 SOTA。它可以从详细的科学图表中提取精确数字,也可以仅从截图出发重建一个 Web 应用的完整源代码

一个极具说服力的测试:之前的 Claude 模型即使配备了复杂的辅助工具(地图、导航指令等),也难以通关 Pokémon FireRed。Fable 5 仅凭原始游戏截图(纯视觉输入、无辅助信息)就完成了整个游戏。

4. 记忆与长上下文:持续聚焦百万 token

Fable 5 能在百万级 token 的长期运行任务中保持专注,并通过自己的笔记改进输出。在测试中,赋予它持久化文件记忆后,Fable 5 在 Slay the Spire 游戏中的表现提升幅度是 Opus 4.8 的三倍,且进入最终关卡的频率也高出三倍。

5. 生命科学与科研:从假设提出到实验验证

这是差距最明显也最值得关注的维度。

领域能力表现
药物设计Mythos 5 在蛋白质设计任务中,无需人工协助即可匹配甚至超越熟练科学家的水平。14 个蛋白质靶点中有 9 个产生了值得进一步研究的候选药物
分子生物学假设在盲测对比中,科学家更倾向 Mythos 5 的分子生物学假设的比率约 80%。其中一个假设已由独立研究团队的实验间接证实
基因组学Mythos 5 自主完成了跨 138 个动物物种、数百万细胞的单细胞数据整合,训练的自定义模型比 Science 期刊上近期发表的工作小 100 倍,但表现更好

Fable 5 的安全新范式

Mythos 级模型的能力已达到一个临界点——它们既有巨大的正向应用潜力,也带来了实质性的滥用风险。

Anthropic 的做法不是一刀切的拒绝或完全开放,而是引入了分类器回退机制

分类器覆盖的三个领域

当分类器检测到以下领域的请求时,Fable 5 不会直接拒绝,而是自动将回答切换到 Claude Opus 4.8(也是一款很强大的模型),并告知用户这一切换:

  1. 网络安全:Mythos 模型在漏洞发现和利用方面能力极强,能显著降低网络攻击的成本和门槛。分类器覆盖了从漏洞利用到完整攻击链的各类任务

  2. 生物学与化学:过去 Anthropic 只阻断与生物武器相关的窄范围查询,但现在他们认为这不够了。Mythos 5 在 AAV(腺相关病毒)设计等任务上的能力已超过专门的蛋白质语言模型——这既有巨大的治疗价值,也有双用途风险

  3. 模型蒸馏:针对将 Fable 能力提取(蒸馏)到竞争模型的大规模尝试

安全机制的实际效果

指标数据
触发回退的比例< 5% 的会话
外部红队测试1000+ 小时未发现通用越狱
有害单轮请求零通过率(含 30 种公开越狱技术)
UK AISI 进展在长表单 Agent 任务上取得了部分进展(尚无可用越狱)

Anthropic 明确表示:当前的安全设置偏保守,有些无害请求也可能被拦截。他们的目标是随着模型迭代不断降低误报率。

30 天数据留存政策

针对 Fable 5、Mythos 5 及未来更高能力模型,Anthropic 要求对所有流量保留 30 天日志。数据仅用于安全目的(检测新型越狱、减少误报),不用于训练新模型。


业内反馈

已获得早期访问权的机构给出了具体反馈:

Stripe:Fable 5 将数月工程压缩为数天。5000 万行 Ruby 代码的全库迁移一天完成。

GitHub CPO:Fable 5 在早期测试中处理了复杂的长期编码任务,自主性和可靠性超越了此前所有基准。

Cursor 产品总监:这是我们测试过的 Claude 模型中结果最强的。Agentic 编码和原型设计上明显进步。

Cognition:Fable 5 在 FrontierBench 上得分最高,长期推理能力突出,对不熟悉的工具能开箱即用。

IMC 首席科学家:Fable 5 在每一档 effort 级别上都优于 Opus 4.8,且运行速度快 25-30%。

也有坦诚的评价:

一位技术团队成员提到:「Fable 5 给人的感觉是实质性的不同——不仅仅是一点进步。」

另一位研究者说:「在 36 小时内它几乎达到了 GPT-5.5 花了四天才到的水平。」


第三方基准:登顶 Artificial Analysis 智能指数

除了官方发布的数据,独立评测机构 Artificial Analysis 在同日发布了更全面的第三方基准评估。Claude Fable 5 在其 AI 智能指数(Intelligence Index) 中排名第一。

核心分数

指标数据对比
Intelligence Index 总分64.9第 1 名,领先第 2 名(非 Anthropic 模型)约 5 分
前 10 名分布Anthropic 占据 TOP 2Fable 5 + Opus 4.8
AA-Omniscience(知识/幻觉基准)40 分+7 分超过前 leader Gemini 3.1 Pro Preview
GDPval-AA(真实工作任务)Elo 1932大幅超越 Opus 4.8
** Humanity’s Last Exam**53%+7 分超过 Opus 4.8 max
HLE 运行成本~$2,200含回退调用,评估中最高的模型

值得注意的是,Fable 5 在 10 个底层基准中有 5 个拿到了最高分

Agentic 能力全面领先

Artificial Analysis 的评估覆盖了三个 Agent 场景基准,Fable 5 全部处于前沿:

Agent 基准场景表现
GDPval-AA真实世界知识工作Elo 1932,显著领先 Opus 4.8
Terminal-Bench HardAgent 编程分数最高的模型之一
Tau2-bench Telecom工具调用(客服场景)前沿水平

关于回退的独立数据

Anthropic 官方表示「回退发生在 <5% 的会话中」。Artificial Analysis 的独立测试给出了更具体的数字——在智能指数相关的任务中,约 8% 的任务触发了回退,主要集中在 GPQA(科学问答)、AA-Omniscience 和 Humanity’s Last Exam 中的科学类问题。

在 HLE 子集中,回退比例达到 9%,这也是为什么 Fable 5 的 HLE 运行成本高(约 $2,200)——不仅因为模型本身贵,还因为回退到 Opus 4.8 也产生额外调用。

定价与可用性补充

信息细节
输入/输出定价$10 / $50 每百万 tokens
缓存写/读$12.50 / $1 每百万 tokens
上下文窗口1M tokens(与 Opus 4.8 相同)
订阅免费期6 月 22 日前 Pro/Max/Team/Enterprise 免费使用(但消耗 2 倍 Opus 用量)
6 月 23 日后需使用 credits 调用

插曲:GPT-5.5 在 Agents’ Last Exam 上意外反超

就在 Fable 5 登顶各大基准榜单的第二天,一个意外的消息打破了「Anthropic 全面领先」的叙事。

「Agents’ Last Exam」(智能体末日考试)——一个专门测试模型在真实智能体任务中执行能力的新基准——公布的结果显示:GPT-5.5 击败了 Claude Fable 5。

这条新闻出现在 2026 年 6 月 10 日深夜,发布时间与 Fable 5 的官方发布仅隔了一天。

发生了什么?

「Agents’ Last Exam」不同于 Humanity’s Last Exam(HLE)——后者侧重知识问答和推理,前者聚焦于多步骤的智能体任务:工具调用、环境交互、长链路规划与执行。两个基准测试的是不同的能力维度。

在这个智能体专项基准上,GPT-5.5 实现了意外反超

这意味着什么

从消息本身来看,这至少说明三点:

  1. GPT-5.5 的智能体能力被低估了。一个发布已近两个月的模型,在 Fable 5 发布的第二天还能在一项新基准上反超,说明 OpenAI 在 Agent 方向的积累并非停滞,而是在新的评估维度下得到释放。

  2. 「军备竞赛」从纯语言能力转向 Agent 能力。Fable 5 在 HLE(53%)和 AA 智能指数(64.9)上全面领先。但 GPT-5.5 在 Agents’ Last Exam 上拿回一分。这说明两个模型在不同能力谱系上各有强项——Fable 5 在知识和推理上占优,GPT-5.5 在 Agent 执行上不弱。前沿竞争正在从「谁更聪明」走向「谁更能干活」。

  3. 基准选择决定了叙事。如果只看 HLE 和 AA 指数,结论是「Fable 5 一骑绝尘」。如果只看 Agents’ Last Exam,结论是「GPT-5.5 意外反超」。现实是两者并存——两个模型都是断档级存在,只是侧重点不同。

回到更大的图景

Fable 5 发布当天,一位测试者曾说:「在 36 小时内它几乎达到了 GPT-5.5 花了四天才到的水平。」

现在来看,这句话可能需要补上后半句:「——至少在非 Agent 的任务上。」

Agents’ Last Exam 的结果提醒我们:在 AI 能力快速膨胀的时代,没有任何一个模型在所有维度上遥遥领先。真正的竞争不是一场考试定胜负,而是多个基准、多个维度、多轮迭代的持续拉锯。

这也正是这个行业最有趣的地方——你永远不知道下一份榜单会带来什么反转。

一句话总结

Claude Fable 5 / Mythos 5 的发布是 AI 前沿能力的一次跃迁——在软件工程、金融分析、视觉理解、生命科学研究等多个维度同时刷新了天花板。

但更值得关注的或许是它的发布方式:分类器回退 + 可信访问 + 30 天数据留存的三层安全架构,正在成为前沿模型治理的新范式——不再是「要么封死要么全开」,而是在能力释放与风险管控之间建立精细化的分层机制。

参考资料

  • Anthropic 官方公告:Claude Fable 5 and Claude Mythos 5. 2026-06-09. → https://www.anthropic.com/news/claude-fable-5-mythos-5
  • Artificial Analysis 评测:Claude Fable 5 Launches at #1 on the Artificial Analysis Intelligence Index. 2026-06-10. → https://artificialanalysis.ai/articles/claude-fable-5-mythos-intelligence-index
  • Agents’ Last Exam 相关报道:GPT-5.5 在智能体末日考试中击败 Claude Fable 5. 2026-06-10. → Google News

文档信息