Anthropic神话级模型解禁，发布Claude Fable 5！

夕小瑶

568人浏览 · 2026-06-10 09:33:29

夕小瑶 · 2026-06-10 09:33:29 发布

刚刚，Anthropic 把那只传了好几个月的神话级 Claude放出来了。

名字也很有意思：Claude Fable 5。

Fable，寓言。

但它背后真正的影子，叫 Mythos，神话。

如果只看名字，它像是 Claude 家族新成员。但如果把背景、能力、安全机制和价格放在一起看，这次发布意义非凡！

性能上，毫无疑问的全方面大飞跃：

按照官方说法，它在软件工程、知识工作、视觉理解、科学研究等几乎所有测试领域都达到了最前沿水平。任务越长、越复杂，它相对之前 Claude 模型的优势越大。

不过，相比于Mythos 的完整版，Fable 只是一个「残缺」的公开版。

虽然底层能力接近，但 Fable 5 多了一套安全分类和模型路由机制。一旦请求涉及网络安全、生物化学风险、模型蒸馏等敏感方向，它就不会继续用 Fable 5 回答，而是自动切回 Claude Opus 4.8。

也就是说，普通用户这次确实摸到了 Mythos 级别的能力。

但只摸到了一部分。

大家等的是神话，Anthropic 最后交付的是一则被安全护栏包起来的寓言。

更有意思的是，Fable 这个名字刚出来，OpenAI 那边也有人下场玩梗了。

Codex 负责人Tibo 翻出自己 4 月的一条旧推，大意是：想象一下，如果我们把 GPT-5.4-Pro 命名成 Fable，会是什么画面。

现在 Anthropic 真的把 Mythos-class 的公开版叫成了 Claude Fable 5，这条旧推瞬间有了回旋镖效果。

评论区也开始阴阳怪气：有人说“这太搞笑了”，有人吐槽“尴尬，Mythos 看起来也就 GPT-5.4 水平，等 GPT-5.6 吧”。。

调侃归调侃，对普通 Claude 用户来说，这次还是很香。

如果你不用它做高风险网络安全、生物化学、模型蒸馏这些事情，Fable 5 大概率就是目前最强的公开 Claude。

一个词总结叫—代际提升。

Karpathy 的推文里有个说法我很认同：可以交给 AI 的任务边界，又被往外推了一圈。

作为 Claude Mythos Preview 的后代模型。从目前公开信息看，Fable 5 的优势主要集中在几个方向：

软件工程、复杂知识工作、视觉理解、长上下文、多步骤任务和科学研究。

但 Fable 5 真正拉开差距的地方，而是当任务变长、变量变多、目标变模糊时，它还能继续推进。

◈编程断档领先

Fable 5 最亮眼的场景，仍然是编程。

SWE-bench Pro 上 80.3%，Opus 4.8 是 69.2%，GPT-5.5 只有58.6%。

从Coding表中可以看到，真的完胜4.8和GPT。。

公开报道中提到，Stripe 曾用 Fable 5 在一个约 5000 万行 Ruby 代码库中完成全库迁移。这个工作如果由工程团队手动完成，通常可能需要数月，而 Fable 5 将其压缩到了极短时间内。

如果一个模型能在这种场景里稳定工作，哪怕只能承担其中一部分，也意味着软件开发的成本结构会继续被重写。

◈视觉：AI 开始真正“看懂屏幕”

另一个很有信号意义的能力，是视觉。

之前很多模型也能看图，但那种“看图”更多是识别图里有什么，或者回答图表上的问题。

而 Fable 5 可以把视觉信息当作行动依据。

在专注于视觉文件推理的基准测试GDPpdf上，Fable 5和Mythos 5在不借助外部工具的条件下拿到了29.8%的成绩，Opus 4.8得分为22.5%，GPT-5.5得分为24.9%，Gemini 3.1 Pro得分为16.7%。

Anthropic官方也猜大家看一堆数据很枯燥，于是放出了Fable 5打游戏的Demo，更具直接视觉效果。

此前的Claude模型如果想玩RPG游戏《宝可梦·火红版》，必须在外部为其配置一套极其复杂的“脚手架”（包括地图导航援助、内存游戏状态读取等）。

现在，Fable 5实现了纯粹的“原生视觉盲打”。

仅凭一张张原始的游戏屏幕截图，在没有任何地图外挂的前提下，它完全自主推演、策略规划，硬生生打通关了整部游戏。

真实世界里的软件，本来就是屏幕。

这也是为什么视觉能力和 Agent 能力会绑在一起。

未来很多 AI 助手，不会只是等你把资料复制粘贴给它，而是直接看你看到的界面，理解你正在做什么，然后继续往下干。

◈上下文与记忆：不会失忆，才配长期干活

这次升级的另一个重点，是长上下文和记忆。

官方说法：Fable 5 能在百万级 Token 的长期任务里保持专注，还会主动用自己记的笔记改进后续输出。

测试场景又是游戏——《杀戮尖塔》。接入持久化文件记忆后，Fable 5 的表现提升幅度是 Opus 4.8 的三倍，打到最终章节的频率同样翻了三倍。

顺着这条线，Anthropic 还反复强调了一个词：Token 效率。

逻辑不复杂：越能长时间自主工作的模型，越烧 Token。一个模型如果一边很强、一边很"费话"，账单很快会让企业肉疼。前面物理科研那个 case——只用 1/3 的推理 Token，36 小时追平对手四天的产出——讲的就是这件事。

说白了，强不强是技术问题，用不用得起是商业问题。Fable 5 把这两个问题一起答了。

◈前沿科研：藏着掖着的 Mythos，终于在这里现身

科研板块要分两层看：台前的 Fable 5，和幕后的 Mythos 5。

台前的部分：物理研究机构和初创公司 VibeCAD 测试显示，Fable 5 只用 1/3 的推理 Token，36 小时内产出的物理研究成果，逼近 GPT-5.5 四天的工作量。

而幕后那个一直没露面的满血版 Mythos 5，这次终于放了点战绩出来。

在生物医药领域，Mythos 5 已经能在零人类协助的情况下，独立跑完一个生物学家的完整工作流：自己选蛋白质结合位点，自己调度生物信息学工具，跑挂了自己 Debug。

它设计的 14 个蛋白质靶向复合物里，9 个已经进入实验室的真实药物研发管线。

盲测环节更直接：与 Opus 系列对比，科学家在 80% 的情况下更倾向 Mythos 给出的分子生物学假设。其中一个假设——关于大肠杆菌蛋白的一种新解毒机制——后来被另一家独立实验室的研究证实了。AI 提的科学假设，被人类实验室验证为真，这在以前是科幻小说的桥段。

最夸张的一条留在最后：基因组学研究中，Mythos 5 自主工作了一周多，整合 138 个物种的单细胞数据，然后自己设计、自己训练了一个定制的微型机器学习模型。这个由 AI 亲手训练出来、体积小 100 倍的小模型，表现直接击败了前不久刚发表在《Science》上的最新成果。

AI 不只在做科研，AI 开始造工具做科研了。

不过注意一个细节：以上 Mythos 5 的所有战绩，你都只能"听说"。

它至今只对 Project Glasswing 合作伙伴和特定生物学研究人员开放。最好的故事，发生在你进不去的房间里。

◈价格：强是真的强，贵也是真的贵

当然，说到这里必须泼一点冷水—Fable 5 不便宜。

公开价格是每百万输入 token 10 美元，每百万输出 token 50 美元。

这价格是Opus标准版的两倍，不到Mythos Preview的一半，GPT-5.5 Pro的六分之一。

Ps：为了庆祝Fable5的发布，最近Claude重置了5小时和速率限制。

Mythos 是神话，Fable 是寓言。神话留在了只有巨头能进的房间里，寓言被包上护栏，交给了我们。

先在受控环境里验证，再把成熟的部分开放，这套节奏在前沿 AI 行业里，算是走出了一条新路子。

模型在分层，用户在分级，能力在分发。AI 行业花了三年时间回答“AI 能不能做”，而 Fable 5 发布这天，问题悄悄换了——

不是 AI 能不能做，是你被允许用它做什么。

这是更安全的必经之路，还是会带来新的不平衡？这个问题，留给时间。

亚马逊云科技技术品牌专区

更多推荐

Kiro Editor 开发实战：使用 Cargo 构建、测试与性能优化指南

欢迎来到这篇终极指南，我们将深入探索如何使用Rust构建高性能的终端文本编辑器Kiro Editor。无论你是Rust新手还是经验丰富的开发者，这篇完整教程将带你了解如何利用Cargo工具链进行高效的开发、测试和性能优化，打造一款快速、轻量且功能强大的UTF-8文本编辑器。## 什么是Kiro Editor？Kiro Editor是一款使用Rust编写的极简终端文本编辑器，它最初是著名编辑