玛格丽特·阿特伍德只试了一次 Claude,就踩到了生成式 AI 最常见的坑。

据 Deadline 转述、The Verge 报道,这位《使女的故事》《盲刺客》作者在葡萄牙波尔图 Babell 文学与文化节受访时说,她曾用 Anthropic 的 Claude 查询英剧《布朗神父》信息,结果得到错误答案。

她的原话很直:“Claude 给了我错误答案,或者说它撒谎了。当然,它不知道自己在撒谎,因为它不是人,而是一个大语言模型。”

这句话容易被误读。阿特伍德不是说 AI 有主观欺骗意图。她说的是另一件更麻烦的事:机器不知道自己错了,但人可能把它当成知道。

发生了什么:一次试用,不是一场评测

这件事的边界要先放清楚。

阿特伍德没有做系统测试,也没有给 Claude 写产品评测。公开报道里能确认的是:她只提到一次个人使用经历,问题和《布朗神父》有关,Claude 的回答错了。

所以,这不能证明 Anthropic 的产品整体失效,也不能拿来当“大模型不可靠”的实证报告。证据没到那一步。

但它仍然有意义。

因为这个错误出现在一个很普通的使用场景里:用户问一个具体知识点,模型给出一个看似完整的答案。很多人用 AI,恰恰就是这么用的。

阿特伍德用“garbage in, garbage out”概括这个问题。中文常说“垃圾进,垃圾出”。意思很朴素:输入材料有缺口、有偏差,输出就可能跟着歪。

她提到,模型可能看过不少电视评论,但评论往往不会剧透结局。于是,大模型从不完整文本里拼出答案,就可能拼错。

这不是玄学。大模型擅长根据已有语料生成连贯文本,但它不等于事实数据库,也不等于编辑部资料室。

为什么重要:AI 错了,也能错得像真的

我更在意的,不是 Claude 这一次答错。

更麻烦的是,大模型的错误往往长得不像错误。它语气稳定,句子顺滑,格式整齐。读者一眼看过去,很容易放松警惕。

这正是内容创作者和知识工作者最容易被坑的地方。一个粗糙答案会提醒你回去查,一个漂亮答案反而会让你少查一步。

几类工具的边界,可以简单分清:

工具或角色适合做什么主要风险更稳妥的用法
Claude、ChatGPT、Gemini 等聊天机器人起草、摘要、改写、梳理思路把缺失或错误信息写成确定答案关键事实必须回查来源
搜索引擎与数据库找网页、文献、条目入口信息分散,需要筛选交叉验证多个来源
人工编辑、研究者、作者本人判断事实、语境、取舍慢,成本高保留最终把关权

这张表不是说 AI 不能用。恰好相反,AI 很适合做初稿、提纲、归纳和语言润色。

问题在于,起草和定稿不是一回事。帮你快一点,也不等于替你负责。

阿特伍德还提到,即便是商业使用 AI,也必须检查,因为它会犯错。这句话对企业尤其现实。

企业采购 AI 工具时,不能只算节省了多少人时。还要算核验成本、返工成本,以及错误进入公开材料后的信任成本。

如果内容团队把 AI 当实习生,用它来打底稿,风险可控。若把它当终审编辑,问题就会转到品牌、合规、版权和客户信任上。

谁最受影响:普通用户别全信,创作者别省查证

对普通读者来说,最实用的动作很简单:把 AI 回答当线索,不要当结论。

问剧情、人物、时间、引文、政策、医学、法律、财务信息时,至少再看一个可靠来源。越是会影响决定的信息,越不能只信一个漂亮答案。

对内容创作者和知识工作者来说,动作要更具体:AI 可以进流程,但不能站在流程最后一关。

写稿、做方案、做研究摘要时,可以让 AI 帮忙列结构、整理材料、改语气。涉及人名、作品名、时间线、原话、数据和结论出处时,要保留人工核验。

团队层面也该调整工具用法。不是简单禁用,也不是全面放开,而是把“哪些内容必须查源”写进流程。

例如,营销团队可以继续用 AI 起草文案,但发布前要有人查产品参数和引用来源。编辑团队可以用 AI 做摘要,但不能让它替代事实核查。采购 AI 的企业,也应要求工具提供来源提示、错误提醒和人工复核接口。

接下来真正该看的,不是哪一次聊天机器人又答错了。单个案例说明不了太多。

更值得看的是:AI 产品能不能把可追溯来源、置信提示、引用边界和人工复核做成默认动作。如果这些仍靠用户自觉,错误就会继续混在流畅文本里。

阿特伍德这次批评的锋利处,也在这里。

她不是在说机器坏,而是在说人会偷懒。人不是机器人,但人会投机。只要有一条省事、难查、还能交差的路,就一定有人走。

回到那次《布朗神父》的查询,问题不只是 Claude 答错了。问题是,如果提问的人不查,那个错误就会被当成知识继续传下去。

这才是“垃圾进,垃圾出”最现实的一面:垃圾不只会进模型,也会从模型进到人的判断里。