Anthropic 刚警告前沿 AI 可能太危险,几天后又把 Claude Fable 5 推向公众。

这就是这次发布最反常的地方:不是完全封闭,也不是彻底放开。Anthropic 把首个公开可用的 Mythos 级模型放进 Claude API 和部分企业、订阅计划,同时给它装上硬护栏。

模型更强了。门票也变厚了。

Fable 5 到底开放了什么

Fable 5 是 Anthropic 首个面向公众开放的 Mythos 级模型。Mythos 此前主要给少数合作方使用,后来扩到 15 个国家、数百家关键基础设施相关组织。现在,开发者和企业客户可以在 Claude API 里接入这一档能力。

Anthropic 给它的定位很清楚:软件工程、知识工作、视觉能力。

但这不是无限制开放。高风险领域会被拦截,必要时回退到 Claude Opus 4.8。

维度Fable 5 / Mythos 5 的安排对使用者的影响
可用范围Claude API、按量企业计划;部分订阅计划阶段性开放开发者和企业能更快试用,但不是所有计划同时拿到
主打能力软件工程、知识工作、视觉能力更适合代码、分析、文档、视觉理解等复杂任务
高风险限制网络安全、生物、化学、模型蒸馏等场景拦截敏感任务不能默认由最强模型回答
回退机制高风险场景回退到 Claude Opus 4.8安全规则优先于模型能力
数据留存所有 Fable 5 / Mythos 5 流量保留 30 天即便企业此前有零留存协议,也要接受例外
价格输入 10 美元/百万 token,输出 50 美元/百万 token是 Opus 4.8 的两倍

Anthropic 说,至少 95% 的会话可以完全由 Fable 5 自身完成,不需要回退。它也强调,30 天留存不用于训练,只用于防御新攻击、发现越狱、降低误杀。

第三方反馈偏正面。Hex 称 Fable 在复杂分析任务基准上首次达到 90%;Base44 称它更擅长一次生成完整应用和工具调用;Genspark 称它在 UI 设计、游戏编码等任务上表现更强。

这类说法可以参考,但别当成完整独立基准。它们更像早期使用反馈,不是全面横评。

反常点不是开放,而是边喊刹车边卖车

发布节奏很微妙。

Anthropic 不久前刚呼吁主要 AI 实验室为前沿 AI 发展设置“协调刹车”。理由是系统进步太快,未来可能接近递归自我改进,也就是 RSI。

这里要说清楚:Anthropic 不是说已经发现模型能自我改进。它是在警告风险窗口可能靠近。

然后,Fable 5 开放了。

这不是简单打脸。更像前沿模型公司共同的处境:安全叙事不能停,商业化也不能停。Anthropic 还准备进入公开市场,它需要向外界证明能力还在涨,收入也能跟上。

“天下熙熙,皆为利来。”这句话放在这里不刻薄。前沿 AI 公司不是慈善机构,烧钱训练出来的模型必须变成收入。问题在于,安全被拿来定义新的使用规则。

Fable 5 给出的答案很直接:强模型可以卖,但要带三件东西一起卖。

  • 拦截.高风险问题不能随便答。
  • 留存.所有相关流量保留 30 天。
  • 涨价.输入、输出单价都比 Opus 4.8 高一倍。

这才是发布的核心变化。不是 Fable 5 有多会写代码,而是 Anthropic 正在把“安全成本”写进前沿模型的标准合同。

这里有一个现实对比。

过去企业评估模型,主要看准确率、上下文、稳定性、价格。现在要多看一项:为了用最强模型,能不能接受平台保留流量。

对做内部知识库、代码助手、客户支持自动化的团队,这不是小字条款。代码、客户数据、研发资料、工单内容,都可能进入模型调用链。Anthropic 说不用于训练,这能降低一部分担忧,但不能消除合规和供应商风险。

企业真正要算的是账单和控制权

工程负责人接下来不会只问“Fable 5 强不强”。更现实的问题是:哪些任务值得上 Fable 5,哪些任务继续留在 Opus 4.8 或更便宜的模型上。

这会直接改变采购动作。

有敏感数据的企业,可能会延后迁移,先让法务、合规、安全团队重审数据处理条款。已经有零留存要求的客户,也要重新判断:30 天留存是不是能进自己的风险边界。

开发团队也会调整工具链。高价值任务可以上 Fable 5,比如复杂代码生成、跨文档分析、视觉推理。普通摘要、分类、客服草稿,没有必要用两倍价格硬跑。

Fable 5 的输出价格是每百万 token 50 美元。复杂推理任务往往会产生更多中间步骤,真实账单未必按一次请求线性增长。强模型很容易把“更聪明”变成“更贵”。

平台方当然有理由。

越强的模型越容易被攻击。越狱、滥用、模型蒸馏,不可能靠一句承诺解决。安全团队要看日志、看模式、看失败样本。没有留存,很多防御只能靠猜。

但代价也很清楚。

一旦这个逻辑跑通,行业默认值可能会变:想用最强模型,就接受更长留存;想拿更高能力,就接受更强平台控制;想跑在前面,就付更高单价。

这有点像早期铁路和电力网络。不完全一样,但权力结构相似。基础设施越关键,收费者越能定义入口、价格和规矩。AI 模型现在也在往这个方向走。

所以我更在意三个变量。

变量该看什么为什么重要
回退比例Anthropic 所说 95% 自完成能否稳定如果高风险误判多,体验和成本都会受影响
留存例外30 天留存会不会成为最强模型默认条款这决定企业能否继续坚持零留存
任务分层企业是否只把少数高价值任务迁到 Fable 5这决定 Fable 5 是主力模型,还是昂贵的专家工具

Anthropic 这次并不是裸奔。它做了压力测试、红队测试,也设置了高风险回退。少见的是,它把安全成本摆到了台面上,没有假装能力提升是免费礼物。

但门槛已经立起来了。

前沿模型的竞争,表面看是基准分、编码能力和视觉能力。背后看的是谁能定义使用规则。模型越强,平台越像收费站。你可以上高速,但车速、记录、路线和票价,都不再只由你说了算。