Fable 5 和 Mythos 5 才上线几天,Anthropic 就在周五晚上把它们全关了。
反常点在这里:美国商务部的指令要求限制两款新模型在美国境外使用,Anthropic 为了立刻合规,选择全球用户一刀切关闭访问。不是永久禁令,也不是公司主动安全召回。其他 Anthropic 模型暂时不受影响。
这件事的味道变了。前沿模型以前拼参数、拼推理、拼价格,现在开始拼一个更硬的变量:发布之后,政府会不会突然按下暂停键。
这次到底关了什么
| 项目 | 信息 |
|---|---|
| 下令方 | 美国商务部,依据出口管制指令 |
| 被关闭模型 | Fable 5、Mythos 5 |
| 影响范围 | Anthropic 暂时关闭所有用户访问,以确保合规 |
| 不受影响 | 其他 Anthropic 模型 |
| 政府担忧 | Fable 5 的 jailbreak 可能绕过网络安全、化学、生物等安全分类器 |
| Anthropic 说法 | 证据只是口头提供,且属于狭窄、非普遍的 jailbreak |
政府的说法是,相关 jailbreak 可能绕过模型对网络安全、化学、生物等危险主题的分类器,需要给“国家安全体系”一些时间加固。Axios 引述消息称,这种加固可能在数周内完成。
Anthropic 并不买账。公司说,政府提供的只是口头证据,指向的是让 Fable 5 审查特定代码库漏洞的狭窄场景。公司目前看到的,也只是发现较小、相对简单的软件漏洞。它还强调,类似能力在其他公开模型上也存在。
这就把争议压到了一个很窄、但很关键的问题上:一个非普遍、范围有限的 jailbreak,够不够叫停一个已经商业发布、面向大量用户的前沿模型?
真正的分歧不是安全,而是标准
我不觉得 Anthropic 是在否认风险。前沿模型当然有风险,尤其是当它们开始能审查代码、辅助漏洞分析、处理敏感科学信息时。问题在于,监管标准如果含糊,行业就会进入一种新状态:模型发布不再只是产品决策,而是随时可能变成国家安全审查事件。
Anthropic 那句警告很重:如果用这个标准套全行业,几乎会叫停所有前沿模型发布。
这不是夸张。因为今天的前沿模型,很难保证不存在任何狭窄 jailbreak。安全分类器、防护策略、红队测试,本质上都是不断补洞。只要“存在一个可演示的绕过方式”就足以触发下架,那模型公司会被迫重新计算发布成本。
以前的成本是算力、数据、训练失败率、推理价格。以后还要加上三项:
- 发布前安全测试要做到什么程度;
- 海外访问如何分区、限流、审计;
- 一旦政府临时叫停,客户合同和产品路线怎么兜底。
这对 AI 产品团队尤其现实。你接入的不是一个普通 API,而是一个可能被出口管制、国家安全审查、临时指令影响的基础设施。模型能力越靠前,合规不确定性越高。
“天下熙熙,皆为利来。”但前沿 AI 的麻烦在于,利还没完全算清,权已经进场了。铁路、电报、核能、互联网早期都走过类似路径:技术一旦被认为关乎国家能力,商业节奏就不可能完全由公司自己说了算。
当然,今天的 AI 和核能不完全一样。一个代码漏洞审查能力,也不能直接等同于现实国家安全事故。材料里没有显示 Fable 5 已造成实际伤害,也没有公开完整证据。把担忧讲成事故,是夸大;把政府刹车讲成无理取闹,也太轻率。
更准确的判断是:前沿 AI 进入了监管分水岭。模型看着还在产品货架上竞争,背后已经开始按军民两用技术的逻辑重新定价。
公司以后不能只会“快发”
过去两年,模型公司的发布节奏有点像手机厂:更强、更快、更便宜,最好发布当天就开放 API。这个逻辑还会继续,但不会再那么顺。
Fable 5 和 Mythos 5 这次被关,短期是客户中断,长期是行业信号。以后模型厂商发布新模型,不能只准备 benchmark、价格表和演示视频,还要准备一套能经得起政府追问的安全证据链。
不是一句“我们做了红队测试”就够了。
证据要可复核,边界要讲清楚,海外访问要能快速隔离。否则一旦指令下来,最稳妥的合规动作就会变成这次这样:全球关停。对客户来说,这比模型答错题更麻烦。答错题可以修,基础设施突然消失,业务只能硬扛。
所以这事不是 Anthropic 一家的尴尬。它是在提醒所有把前沿模型当底座的人:AI 供应链里,政策风险已经和延迟、价格、上下文长度一样,成了产品参数。
