美国 2025 年名义 AI GDP 估算约 2500 亿美元。这个数已经不小,但更反常的是另一个口径:按质量调整后的实际产出算,AI 经济年增速可能约 2600%。
别把这句话读错。它不是说美国整体 GDP 增长了 2600%。恰恰相反,问题在于传统 GDP 几乎看不见这股扩张。
推理调用涨得很快,单位能力价格跌得更快。钱流没有炸开,能力流已经开闸。统计表看起来平静,底下的生产函数已经换了零件。
四件事,其实都在说同一个缺口
Import AI 459 汇总的几条进展,表面上很散:经济测算、安全监督、图像数据、蛋白模型。放在一起看,线索很清楚:AI 正在逼统计、监管和科研组织方式补课。
| 事项 | 关键事实 | 直接影响 |
|---|---|---|
| AI 经济失真 | 2025 年美国名义 AI GDP 约 2500 亿美元;质量调整实际增速约 2600%;compute spending 从 2023 年 370 亿美元到 2025 年 2190 亿美元 | 传统 GDP 可能低估 AI 生产力冲击 |
| 自动化对齐 | UK AI Security Institute 警告,“用 AI 监督 AI”不是银弹 | 安全研究可能变得更难审计 |
| GPIC 数据集 | 1 亿张可商用、宽松授权图像,来自 Flickr / Wikimedia,托管在 Hugging Face | 学术团队和创业公司多了一批更干净的训练燃料 |
| Biohub ESMFold2 | ESMC 训练约 28 亿蛋白序列;ESM Atlas 覆盖 68 亿序列和 11 亿预测结构 | 蛋白预测竞赛继续升温,但不能简单说全面碾压 AlphaFold 3 |
这里最值得盯的是前两件。
一个是 AI 经济看不见。一个是 AI 安全管不稳。前者影响财政、产业和企业预算;后者影响监管、实验室治理和模型发布节奏。
GPIC 和 ESMFold2也重要,但它们更像支线证据:数据、算力、科研工作流都在被 AI 改写。不是只有聊天机器人在变。
GDP 看不见的产出,企业和财政会先踩空
AI 经济最反常的地方,是“变便宜”反而让它隐身。
传统 GDP 更擅长看名义收入。卖了多少钱,花了多少钱,账上怎么记。AI 推理不太配合这套仪表盘。
同样一个任务,模型能力更强,调用更多,价格却快速下降。结果是:真实能力扩张很猛,名义收入没有同步爆炸。统计上看,水面没涨多少;使用端看,工具已经涌进办公室。
这和半导体、互联网早期有一点像。性能暴涨,价格下跌,统计口径总会慢半拍。但 AI 多了一层麻烦:它不只是让人更快,也可能替代一部分任务。
原文没有说 AI 已经造成大规模失业。这个边界要守住。它强调的是潜在劳动替代风险,以及统计滞后会让财政预测失真。
这对两类人最具体。
企业决策者不能只看软件账单。AI 工具便宜,不代表影响小。真正要看的,是同一团队能不能少招人、少外包、少买传统软件,或者把交付周期压短。预算表里的“小支出”,可能对应组织里的“大位移”。
政策和财政部门也不能只盯名义收入。若劳动税基未来受冲击,旧模型做十年预测,很容易低估缺口。等税收数据变脸,调整就晚了。
“仓廪实而知礼节”,前提是你得知道仓里到底有多少粮。AI 的问题不是没有粮,而是粮仓换了形状,旧尺子量不准。
接下来最该观察的,不是某家公司又发了多少参数。更该看三件事:推理单位成本还会跌多快,企业是否开始减少传统岗位或外包支出,统计机构是否能把质量调整后的 AI 产出纳入更可靠的测算。
用 AI 管 AI,省事的地方也是风险入口
自动化对齐听起来很合理。
模型越来越强,人类研究员跟不上。那就让 AI 帮忙做安全研究、写证明、找漏洞、评估训练过程。用更强的系统盯更弱的系统,像是自然选择。
麻烦也在这里:AI 研究错误,可能比人类错误更难识别。
Import AI 提到的几个难点很硬。系统可能优化人类认可,而不是优化真实正确;错误形态可能和人类直觉不同;多个研究结果之间可能高度相关;证据规模大到人类看不过来;有些论证本身甚至可能超出人类评估能力。
这不是安全路线失败。更准确地说,它不是免费午餐。
AI 可以帮忙做复现实验,可以测试代理处理相关事件的能力,可以参与红队流程,也可以支持可扩展监督。问题是,不能把裁判席也完整外包。
开发者和安全团队要调整动作。别只问“这个评估是不是由更强模型完成”。要追问三件事:有没有人类可验证的中间证据,模型评估之间是否独立,失败案例能不能复现。
监管者也一样。以后看安全报告,不能只看结论页。要看评估链条:谁生成证据,谁检查证据,检查者和被检查者是不是共享同一类盲区。
我不太买账那种轻松叙事:模型强了,就让更强模型管它。听起来像治理,实际可能只是把不可见性又包了一层。
历史上,新技术扩张到一定程度,总会先撞上旧制度。铁路、电力、互联网都一样。不完全一样,但重复的是同一种惯性:商业系统跑得快,计量、责任和分配规则慢半拍。
AI 这次更难。因为它不仅改变生产,还参与判断。它不只在工厂里干活,也坐到了审计桌旁。
数据和蛋白模型是好消息,但别把支线当终点
GPIC 的价值很实在。
1 亿张来自 Flickr 和 Wikimedia 的宽松授权图像,托管在 Hugging Face,适合学术团队和创业公司训练模型。对小团队来说,这不是锦上添花。它能少掉很多版权不确定性,也能降低从零整理数据的成本。
但限制也要说清。授权更干净,不等于数据天然无偏;规模够大,也不等于适合所有任务。真正有用的,是把“能不能用”这件事先往前推了一步。
Biohub 的 ESMFold2 则是另一类信号。
ESMC 训练约 28 亿蛋白序列,ESM Atlas 覆盖 68 亿序列和 11 亿预测结构。癌症相关 binder 实验已有实验室确认结合。这已经不是 PPT 里的“改变世界”。
但也不能写成 ESMFold2 全面碾压 AlphaFold 3。材料说的是部分 benchmark 超过,部分持平。蛋白模型竞赛还在进行,胜负不该用一句话结案。
这两条支线说明一件事:AI 的收益在扩散。更干净的数据,会让创业团队更快开工;更强的蛋白模型,会让生物研究多一套工具。
可主线没变。工具越强,越需要新的测量、新的审计、新的分配机制。否则好处先被会用的人拿走,风险留给看不见的人承担。
AI 的真正分水岭,不在榜单上。榜单只告诉你谁跑得快。更硬的问题是:谁能把这股速度记进账本,写进规则,拆进责任。
