Anthropic 发布 Mythos 5 / Fable 5:前沿模型能力跃迁与安全治理的新平衡

2026/06/10 ai AI · Anthropic · Claude · Mythos 5 · Fable 5 · 前沿模型 2512 字 · 约 8 分钟 阅读 ...
Anthropic 发布 Claude Fable 5 和 Claude Mythos 5 两款新一代前沿模型,在软件工程、知识工作、视觉、生命科学等多领域刷新 SOTA。Fable 5 定价仅为 Mythos Preview 的一半,同时引入了新的分类器安全机制——高风险问题自动回退到 Opus 4.8 回答。

发生了什么?

2026 年 6 月 9 日,Anthropic 正式发布 Claude Fable 5Claude Mythos 5 两款新一代前沿模型。

两者底层是同一个模型,区别在于安全机制的开与关

模型定位安全策略适用对象
Claude Fable 5面向一般用户的 Mythos 级能力分类器拦截高风险领域,回退到 Opus 4.8所有用户(含 API、订阅计划)
Claude Mythos 5面向网络防御者的无限制版本解除网络安全等领域的限制Project Glasswing 合作伙伴及后续可信访问计划

定价:$10/M 输入 token,$50/M 输出 token——不到 Claude Mythos Preview 的一半。


能力升级的五个维度

1. 软件工程:月级的压缩为天数

Stripe 在早期测试中报告了一个惊人的结果:在 5000 万行 Ruby 代码库中,Fable 5 用一天完成了一次全代码库迁移——按之前的手工方式,整个团队需要两个多月。

在 Cognition 的 FrontierCode 评估(衡量模型能否在满足高质量生产代码标准的前提下通过困难的编码任务)中,Fable 5 在中等 effort 水平下的得分就超过了所有其他前沿模型。

2. 知识工作:金融分析、交易推理全线领先

在 Hebbia 的金融基准测试(面向高级分析推理)中,Fable 5 获得了最高分,在文档分析、图表解读和问题解决方面均有显著提升。

IMC 的评估更全面——Fable 5 几乎在所有交易分析维度上取得了优秀成绩,包括事实查询、概念推理、根因分析和期望值分析。

3. 视觉能力:从截图还原完整应用

Fable 5 在视觉任务上达到了新的 SOTA。它可以从详细的科学图表中提取精确数字,也可以仅从截图出发重建一个 Web 应用的完整源代码

一个极具说服力的测试:之前的 Claude 模型即使配备了复杂的辅助工具(地图、导航指令等),也难以通关 Pokémon FireRed。Fable 5 仅凭原始游戏截图(纯视觉输入、无辅助信息)就完成了整个游戏。

4. 记忆与长上下文:持续聚焦百万 token

Fable 5 能在百万级 token 的长期运行任务中保持专注,并通过自己的笔记改进输出。在测试中,赋予它持久化文件记忆后,Fable 5 在 Slay the Spire 游戏中的表现提升幅度是 Opus 4.8 的三倍,且进入最终关卡的频率也高出三倍。

5. 生命科学与科研:从假设提出到实验验证

这是差距最明显也最值得关注的维度。

领域能力表现
药物设计Mythos 5 在蛋白质设计任务中,无需人工协助即可匹配甚至超越熟练科学家的水平。14 个蛋白质靶点中有 9 个产生了值得进一步研究的候选药物
分子生物学假设在盲测对比中,科学家更倾向 Mythos 5 的分子生物学假设的比率约 80%。其中一个假设已由独立研究团队的实验间接证实
基因组学Mythos 5 自主完成了跨 138 个动物物种、数百万细胞的单细胞数据整合,训练的自定义模型比 Science 期刊上近期发表的工作小 100 倍,但表现更好

Fable 5 的安全新范式

Mythos 级模型的能力已达到一个临界点——它们既有巨大的正向应用潜力,也带来了实质性的滥用风险。

Anthropic 的做法不是一刀切的拒绝或完全开放,而是引入了分类器回退机制

分类器覆盖的三个领域

当分类器检测到以下领域的请求时,Fable 5 不会直接拒绝,而是自动将回答切换到 Claude Opus 4.8(也是一款很强大的模型),并告知用户这一切换:

  1. 网络安全:Mythos 模型在漏洞发现和利用方面能力极强,能显著降低网络攻击的成本和门槛。分类器覆盖了从漏洞利用到完整攻击链的各类任务

  2. 生物学与化学:过去 Anthropic 只阻断与生物武器相关的窄范围查询,但现在他们认为这不够了。Mythos 5 在 AAV(腺相关病毒)设计等任务上的能力已超过专门的蛋白质语言模型——这既有巨大的治疗价值,也有双用途风险

  3. 模型蒸馏:针对将 Fable 能力提取(蒸馏)到竞争模型的大规模尝试

安全机制的实际效果

指标数据
触发回退的比例< 5% 的会话
外部红队测试1000+ 小时未发现通用越狱
有害单轮请求零通过率(含 30 种公开越狱技术)
UK AISI 进展在长表单 Agent 任务上取得了部分进展(尚无可用越狱)

Anthropic 明确表示:当前的安全设置偏保守,有些无害请求也可能被拦截。他们的目标是随着模型迭代不断降低误报率。

30 天数据留存政策

针对 Fable 5、Mythos 5 及未来更高能力模型,Anthropic 要求对所有流量保留 30 天日志。数据仅用于安全目的(检测新型越狱、减少误报),不用于训练新模型。


业内反馈

已获得早期访问权的机构给出了具体反馈:

Stripe:Fable 5 将数月工程压缩为数天。5000 万行 Ruby 代码的全库迁移一天完成。

GitHub CPO:Fable 5 在早期测试中处理了复杂的长期编码任务,自主性和可靠性超越了此前所有基准。

Cursor 产品总监:这是我们测试过的 Claude 模型中结果最强的。Agentic 编码和原型设计上明显进步。

Cognition:Fable 5 在 FrontierBench 上得分最高,长期推理能力突出,对不熟悉的工具能开箱即用。

IMC 首席科学家:Fable 5 在每一档 effort 级别上都优于 Opus 4.8,且运行速度快 25-30%。

也有坦诚的评价:

一位技术团队成员提到:「Fable 5 给人的感觉是实质性的不同——不仅仅是一点进步。」

另一位研究者说:「在 36 小时内它几乎达到了 GPT-5.5 花了四天才到的水平。」


一句话总结

Claude Fable 5 / Mythos 5 的发布是 AI 前沿能力的一次跃迁——在软件工程、金融分析、视觉理解、生命科学研究等多个维度同时刷新了天花板。

但更值得关注的或许是它的发布方式:分类器回退 + 可信访问 + 30 天数据留存的三层安全架构,正在成为前沿模型治理的新范式——不再是「要么封死要么全开」,而是在能力释放与风险管控之间建立精细化的分层机制。

参考资料

  • Anthropic 官方公告:Claude Fable 5 and Claude Mythos 5. 2026-06-09. → https://www.anthropic.com/news/claude-fable-5-mythos-5

文档信息