Jeremy Howard 这次点名 Anthropic,刺眼处很具体:你说前沿 AI 应该慢下来,但最强的模型,你自己还在拿来继续做前沿研究。
更别扭的是,按 Howard 的说法,Anthropic 一边允许自己这样做,一边表示会阻止他人类似使用。这里的争议不在于 Anthropic 到底安不安全,而在于一句更硬的问题:如果真怕加速,刹车为什么只装在别人车上?
争议卡在一条对称约束上
Howard 提出的方案很简单。当前拥有顶级模型的实验室,不应使用自家最强模型做前沿 AI 研究;但其他人应该能访问这个模型。
他的逻辑是:领先者不能继续用最强工具扩大领先。这样,前沿不会由同一家机构单方面向前推,权力差距也不会被模型能力继续放大。
这里容易误读。Howard 明确说,他本人并不主张放慢递归式 AI 自我改进。他更支持开放和民主化。他是在质疑一种立场自洽性:如果你声称要减速,又握着最强模型,那至少要先限制自己。
| 问题 | Howard 的设定 | Anthropic 被批评的点 |
|---|---|---|
| 谁该被限制 | 当前顶级模型实验室 | 领先者不能只限制外部使用 |
| 模型能否开放 | 其他人应可访问 | 访问权不能只由平台单方解释 |
| 前沿研究怎么办 | 顶级实验室不用自家最强模型推进前沿 | Howard 称 Anthropic 允许自己继续用 |
| 风险在哪里 | 前沿加速和权力集中同时发生 | 安全叙事可能变成自用优势 |
目前能确认的是 Howard 对 Anthropic 表态和策略方向的批评。不能把它写成 Anthropic 已经实施了某个具体破坏行为。证据只支持说:Howard 认为 Anthropic 选择了和他所说“安全路径”相反的方向。
这件事影响的也不是普通聊天用户,而是更靠近模型能力边界的人:前沿实验室、开源和独立研究者、依赖模型访问权的开发者团队。
对这些人来说,风险很现实。研究计划可能要改路线,工具链可能要准备替代方案,企业里的 AI 团队也会更谨慎地把关键研发流程绑死在单一模型平台上。不是因为模型不好,而是因为访问规则可能随安全解释改变。
顶级模型自用,会同时推高能力和门槛
站在实验室内部,使用自家最强模型做研究很合理。模型能帮研究人员写代码、做实验、分析结果、加快迭代。公司也可以说:我们最懂模型边界,所以我们最适合安全地使用它。
这个说法不是没有道理。安全研究需要接触高能力模型。闭门测试也可能比外部乱用更可控。
但限制也在这里。只要领先者可以用最强模型继续推进前沿,外部研究者却只能在许可、API、条款和封锁边界里活动,局面就变了。
前沿在加速。准入门槛也在升高。
Howard 抓住的正是这个矛盾:如果递归式自我改进危险,那内部递归也危险。不能把外部使用叫风险,把内部使用叫治理。两者都可能推进前沿,只是权力归属不同。
这对开发者和研究社区的动作影响很直接。独立团队会更倾向保留多模型适配,不把评测、Agent 框架或内部研发流程只押在一家接口上。企业采购也可能延后排他性绑定,至少要问清楚:哪些用途未来可能被平台以安全为由限制?限制由谁解释?申诉路径在哪里?
这不是反对安全边界。恰恰相反,越谈安全,越需要边界清楚。模糊的安全条款,最后会变成平台的自由裁量权。
最该观察的不是口号,是谁先约束自己
我更在意的不是 Anthropic 说了多少安全,而是它的安全叙事有没有对称性。
如果它认为前沿加速危险,就需要解释为什么自己的前沿加速更可接受。如果它认为自己有能力安全使用最强模型,也要解释为什么外部研究者天然更像风险源。
“天下熙熙,皆为利来。”这句话放在这里并不刻薄。安全可以是真关切,商业优势也可以同时存在。问题在于,当两者绑在一起,外部很难分清:哪些限制是为了风险,哪些限制是在守护领先地位。
历史上新基础设施成熟时,常见一套说法:集中管理更安全,统一标准更高效。铁路、电力、通信网络都出现过类似逻辑。它不一定错,但缺少对称约束时,闸口就会落到少数人手里。
AI 不完全一样。模型能力确实可能带来更复杂的安全问题,开放也不自动等于安全。开源社区会放大能力,独立研究也可能失控。
所以这场争论不能简化成开源好、闭源坏。更准确的分水岭是:安全治理能不能先管住掌权者自己。
接下来最该看两个变量。
一是领先实验室是否愿意公开说明:自己使用最强模型推进前沿研究时,接受哪些限制,谁来监督,外部能否核验。
二是模型访问权是否会变得更可预期。开发者和研究者不怕规则严格,怕的是规则只在平台需要时才被解释。
Howard 这段批评的价值,不是给出了完美制度。它把一个行业遮着说的问题挑明了:安全如果只约束后来者,就会从治理承诺滑向平台权力。
回到开头那辆车。真正的刹车,要能让驾驶员自己也慢下来。只给旁边车道设路障,不叫安全,叫控路权。
