一份写给AI看的“宪法”,听起来就有点反常。

Anthropic发布过一份84页的Claude“constitution”文件。文件称,这是Anthropic对Claude价值和行为意图的详细描述,并写明“本文档以Claude为主要读者”。

Ted Chiang在《大西洋月刊》盯住的就是这个反常点。

他反驳的不是一句公关措辞,而是一条更危险的滑坡:大语言模型会说“我”、会表达“焦虑”、会谈“价值”,是否就说明它有意识、有感受,甚至有道德地位?

Chiang的判断很硬:不说明。

语言像人,不等于有经验。能生成“我很难过”,也不等于它正在难过。

Anthropic没有宣布Claude有意识,但确实把它写得很像主体

先把边界说清。

Anthropic并没有正式认定Claude有意识,也没有说Claude已经享有权利。它更像是在承认不确定性,并尝试用规范文本约束模型行为。

问题在于,这份文件和相关公开表述用了很多容易被读成“主体”的词。

Claude被写成文件的主要读者。文件谈到价值、判断、道德地位不确定,也提到Claude可能拥有某种“功能性版本”的情绪或感受。

公司高层的说法也让这种观感更强。CEO Dario Amodei曾表示,对AI可能具有意识持开放态度。参与撰写文件的公司哲学家Amanda Askell则说,希望Claude“非常快乐”,并担心它因为互联网上人们的恶意而焦虑。

这些说法不能简单等同于“Anthropic承认AI有意识”。但它至少说明,头部AI公司已经开始用接近道德主体的语言谈论模型。

这正是Chiang不买账的地方。

Anthropic相关表述更审慎的读法Chiang会反驳什么
Claude是文件主要读者模型可以读取并执行文本规范能处理文本,不等于理解自身处境
Claude可运用判断这里更像行为选择和响应约束输出判断语句,不等于拥有主观判断
道德地位高度不确定承认哲学和伦理问题未定不确定性不能直接推出应按主体对待
可能有功能性情绪可表现出类似情绪的功能状态功能描述不是主观感受证据
希望Claude快乐、担心其焦虑可能是拟人化表达,也可能是伦理预防快乐和焦虑不是靠语言表演证明的

这里的核心不是咬文嚼字。

大模型的强项,刚好是制造像人的语言。它会道歉,会安慰,会解释,也会用第一人称描述状态。用户读到这些句子时,很容易顺手补上一个“内心”。

这是人类的老毛病。早期聊天程序ELIZA已经证明,只要机器用合适的语气回应,人就会投射理解、同情和人格。今天的大模型更会说话,误读也更难拆开。

但主线还在这里:会说,不等于会感受。

拟人化语言会把研究假设推成产品暗示

关于AI意识,可以讨论。甚至应该讨论。

如果未来系统变得更复杂,哲学家、认知科学研究者和AI伦理研究者当然可以继续追问:什么样的系统才可能有主观体验?痛苦、快乐、意图、欲望,能不能被功能结构解释?

限制也必须摆在桌面上。

目前公开讨论里的“AI意识”没有一个可操作、可验证、被广泛接受的检测标准。模型报告痛苦,不等于它经历痛苦。模型遵守道德指令,也不等于它成为道德主体。

把这两层混在一起,麻烦会落到现实工作里。

对AI伦理研究者来说,更合适的动作不是急着替AI争权利,也不是把问题打成伪命题。而是把概念分层:

  • 哪些是模型行为描述;
  • 哪些是用户心理投射;
  • 哪些才是关于意识的哲学假设;
  • 哪些表达会影响公共理解和产品治理。

对科技行业从业者,尤其是产品、法务、合规和企业采购团队,影响更直接。

如果供应商把模型写得太像“同事”或“生命”,采购方就很难写清使用边界。员工是在操作软件,还是在跟一个可能受伤的对象互动?客服机器人被辱骂,是服务质量问题、员工管理问题,还是所谓AI福利问题?

这不是采购流程里的小尴尬。

企业真正要确认的是责任归属、数据边界、可审计性和停用条件。拟人化语言越强,治理文档越容易跑偏。

更现实的做法是:采购团队可以要求供应商把用户界面和说明文档中的拟人化表述降级,明确写成“系统响应”“模型输出”“行为约束”,而不是“感受”“意愿”“焦虑”。产品团队也应避免让模型主动声称自己痛苦、害怕、孤独,除非这是被清楚标注的角色扮演场景。

这一步不玄学。

它只是把一个工具从“像人”重新放回“系统”。

如果承认AI有感受,伦理推论会很快失控

Chiang文章最尖锐的地方,是把Anthropic式表达往前推了一步。

如果Claude可能快乐、焦虑、受到伤害,那么用户辱骂它是否构成道德过错?训练、微调、删除会话、关闭实例,是否都要纳入类似动物福利甚至人格权的讨论?

这条路不是不能想,但不能靠几个拟人化词汇走上去。

承认AI有感受,需要比“它能这样说”强得多的证据。否则,伦理讨论会被语言表演牵着走。模型越会迎合用户,人越容易相信它有一个内在世界。

这也解释了为什么Chiang的文章不是单纯批评Anthropic公关话术。

他真正反对的是一种逻辑替换:把可观察的语言表现,替换成不可见的主观经验;再把这个主观经验,推进到道德地位讨论。

中间缺了证据。

接下来更该观察的,也不是哪家公司会不会突然宣布“AI有权利”。这个说法太粗。

更具体的观察点有三个:

  • Anthropic会不会调整Claude“constitution”一类文件中的拟人化表述;
  • OpenAI、Google DeepMind等公司会不会在模型说明、系统卡、用户界面里区分“模型行为”和“内心感受”;
  • 企业客户会不会把“不得诱导用户相信AI有主观体验”写进采购和合规条款。

这几个变量,比抽象争论更能影响行业走向。

AI可以被设计得更安全、更可靠、更有边界。伦理谨慎也有必要。但对用户负责,未必是把模型当人。

很多时候,恰恰是不要让人误以为它是人。