arXiv 这次瞄准的,不是“论文里用了 AI”,而是更低级、也更危险的一类东西:不存在的引用、模型留下的说明文字、没有替换的示例数据。

按计算机科学板块负责人 Thomas Dietterich 的说明,如果投稿中出现“无可争辩的证据”表明作者没有核查大语言模型生成内容,作者会被 arXiv 禁投一年。禁期结束后,后续投稿还必须先被可信同行评审渠道接收,才能再次提交 arXiv。

这个点很关键。

它不是把科研写作拉回纯手工时代。它是在告诉作者:工具可以用,但不能把核查责任也交给工具。

新规罚什么:不是 AI 痕迹,而是未核查的硬伤

处罚触发条件是“incontrovertible evidence”,也就是确凿证据。不是“看起来像 AI 写的”,也不是风格检测分数偏高。

典型问题包括三类:幻觉引用、LLM 元注释、示例数据未替换。比如参考文献根本不存在,正文里残留“作为大语言模型……”之类的说明,或者表格里还写着“本表为示例数据,请替换为真实实验数据”。

这些东西有一个共同点:不是表达风格问题,而是作者没有完成最基本的检查。

规则点具体含义对作者的影响
触发条件有确凿未核查 AI 生成痕迹不能用“只是 AI 辅助润色”来免责
典型证据幻觉引用、LLM 元注释、示例数据残留引文、表格、附录会成为高风险区
处罚流程版主记录问题,Section Chair 确认不是机器自动判罚,但人工审核会更硬
申诉机制作者可以申诉仍有纠错空间,但成本已经上升
后续准入禁投一年后需先获可信同行评审渠道接收预印本发布节奏可能被打断

我更在意的是这个后果:arXiv 把原本偏“事后纠错”的成本,前移到了作者准入上。

过去,低质量投稿可能被拒、被撤,或者被同行在网上指出问题。现在,如果证据足够硬,它会变成一年的禁投记录。对研究生、首次投稿者、独立研究者来说,这不是小惩罚。

最实际的动作也很朴素:投稿前逐条打开参考文献,确认题名、作者、期刊和年份;全文搜索模型常见元注释;检查表格、图注、附录和补充材料里有没有模板残留。别把 arXiv 当成草稿箱。

为什么现在收紧:投稿洪水正在消耗预印本机制

arXiv 的收紧不是孤立动作。

2025 年 11 月,arXiv 已经限制计算机科学类别的综述文章和立场论文。原因很直接:这类文章容易被大语言模型快速拼出来,往往没有新的研究结果,却会占用审核资源。

2026 年 1 月,arXiv 又要求首次投稿者获得既有作者背书,用来应对欺诈性投稿增加。现在再加上一年禁投规则,线索就连起来了:平台不是突然“反 AI”,而是在堵低成本灌水的入口。

外部数据也能解释这种压力。哥伦比亚大学研究人员分析了 250 万篇生物医学论文后发现,2026 年前七周发表的论文中,约每 277 篇就有 1 篇含伪造引用。2023 年这一比例约为每 2828 篇 1 篇,2025 年约为每 458 篇 1 篇。

这个变化说明,假引用已经不只是几个尴尬笑话。它开始变成出版流程里的系统性噪音。

但边界也要说清楚。材料里最突出的压力来自计算机科学类别,不宜直接扩大成所有学科都遭遇同等强度的问题。生物医学论文里的伪造引用数据,可以说明学术出版正面对 AI 垃圾内容压力,但不能简单等同于 arXiv 每个学科的实际负担。

这也是预印本平台的难处。

传统期刊有编辑初筛、同行评审、出版后撤稿。arXiv 的价值恰恰在于快和开放。现在它被迫增加背书、类别限制和禁投处罚,说明开放性和可信度之间的缝正在变宽。

谁受影响最大:作者要自查,平台要加人加工具

对科研作者和研究生,影响最直接。

以后投稿 arXiv,不能只把 AI 当成润色器或初稿生成器。尤其是综述、立场文章、背景介绍和参考文献部分,风险会更高。因为这些部分最容易被模型“写得像真的”,也最容易混进不存在的出处。

对他们来说,投稿前至少要多做三件事:

  • 核对每一条引用是否真实存在,最好不要只看模型输出或二手列表;
  • 检查正文、注释、表格、附录里有没有模型提示语和模板句;
  • 对 AI 生成的概括性段落做事实回查,不能只改语气不改内容。

对学术出版和预印本平台从业者,影响则是流程问题。

低成本生成内容越多,人工审核就越容易被拖垮。平台要么增加背书和准入限制,要么投入检测工具和审核人员。两条路都不免费,也都可能带来误伤。

这里有一个现实约束:规则越严,年轻作者、非主流机构作者、跨学科投稿者的成本越高;规则越松,平台又会被 AI 拼接内容消耗。arXiv 这次选择的是提高违规代价,而不是全面关闭入口。

arXiv 目前由 Cornell Tech 管理,并计划在 7 月成为独立非营利机构。Cornell Tech 院长兼副教务长 Greg Morrisett 曾对 Science 表示,独立化有助于 arXiv 从更广泛的捐赠者处筹资,用于应对“AI slop”等新压力。

这不能硬说成财务危机。更稳妥的判断是:审核、工具和人员成本正在上升,平台需要更宽的筹资来源来扛住这些新负担。

接下来真正该看两件事。

一是申诉机制能不能避免误伤。尤其是非英语作者、年轻作者、首次投稿者,如果只是表达不熟练,不能被粗暴归入 AI 垃圾。

二是“可信同行评审渠道”的边界怎么定。这个边界如果太窄,会把一部分正常研究挡在预印本之外;如果太宽,一年禁投后的再准入就会变成形式。

回到开头那几个残留痕迹:假引用、模型注释、示例数据。它们看起来像小错误,其实戳中的是同一个问题。预印本可以快,但不能快到没人负责。