
大模型之家讯 北京时间6月10日,Anthropic正式发布Claude Fable 5与Claude Mythos 5。这也是此前因安全风险未公开的Mythos级模型,首次正式面向公众开放。
相比上一代Opus 4.8,Fable 5仅用11天便完成迭代,而Opus 4.7到4.8曾耗时43天,显示出Anthropic模型研发节奏正在明显加快。两款模型基于同一基础架构,区别在于Fable 5加入了安全分类机制,而Mythos 5则代表了Anthropic目前公开展示的最高能力水平。

在性能测试中,Fable 5几乎全面领先。在SWE-Bench Pro智能体编程测试中,其成绩达到80.3%,较Opus 4.8提升11个百分点,领先GPT-5.5超过21个百分点;在FrontierCode Diamond测试中,Fable 5得分29.3%,约为GPT-5.5的五倍。同时,它无需开启最高推理资源,中等算力配置即可达到峰值性能。

更受关注的Mythos 5则进一步展示了模型能力上限。在Humanity’s Last Exam(HLE)测试中,Mythos 5在不调用外部工具的情况下,表现超过此前Preview版本,并领先GPT-5.5和Gemini 3.1 Pro。

为了平衡能力与安全,Fable 5采用了一套不同于传统拒答机制的安全方案。当模型检测到网络安全、生物化学以及模型蒸馏等高风险请求时,并不会简单拒绝回答,而是自动降低能力,将响应水平限制在Opus 4.8级别。

Anthropic表示,在相关安全评测中,Fable 5在高风险任务上的成功率被降低至0。同时,这套机制预计仅会影响约0.03%的正常用户请求。针对模型蒸馏等攻击行为,系统也不会向用户提示限制发生,而是在后台通过提示词调整、控制向量等方式进行动态能力管理。
商业化方面,Fable 5 API价格为输入10美元/百万Token、输出50美元/百万Token,不到此前Mythos Preview价格的一半,约为GPT-5.5 Pro的六分之一。目前API已开放,Pro、Max和Team用户可在6月22日前免费体验。(但整体价格仍然远超国内模型)
除了跑分,Anthropic还展示了多个真实案例。例如Stripe利用Fable 5完成一个5000万行Ruby代码库的迁移,原本需要团队数月完成的工作,仅用一天便完成。
原创文章,作者:志斌,如若转载,请注明出处:http://damoai.com.cn/archives/16063