FutureSearch 4 月 12 日发了一篇关于 AGI 时间线的分析,时间点是 2026 年,背景是《AI 2027, One Year Later》讨论之后。
它有意思的地方不在于给出一个新倒计时,而是把一批预测者过去几年的更新摆在一起看:同样在预测 AGI,方向却会跟着当期领先实验室和模型表现来回移动。
我更在意的是这个反常点:如果 AGI 时间线真是一个稳定共识,它不该这么容易被最新模型信号牵动。FutureSearch 的材料至少说明,很多严肃预测并不是一条直线,而是一份持续改账的账本。
这里说的 AGI,不是科幻里的全能智能
FutureSearch 采用的 AGI 口径比较窄:多数纯认知劳动,能以更好的质量、速度和成本被自动化。
这个定义很关键。它不等同于机器有意识,也不等同于科幻作品里的通用智能。它更接近一个工作层面的判断:大量白领任务,是否能被模型稳定、便宜、快速地完成。
样本也有边界。FutureSearch 看的不是所有 AI 名人观点,而是多次发布精确 AGI 预测、并给出置信区间的研究者或预测社区。
这会排除很多热闹声音。因为不少知名人士只偶尔表态,或者没有持续给出可比较的预测。换句话说,这不是名人意见榜,更像一支“预测者温度计”。
时间线来回摆,跟最新模型信号有关
文章观察到的变化,大致可以分成三段。注意,这些是预测方向,不是 AGI 实际到站时间。
| 时间段 | 预测变化 | 相关背景 | 更稳妥的读法 |
|---|---|---|---|
| 2023-2025 | 多数预测提前 | ChatGPT 之后,大模型能力被重新估计 | 预测者上调了对扩展规模短期效果的判断 |
| 2025-2026 | 多数预测推迟 | xAI、Meta、Gemini 等阶段性进展没有形成同样强的外推信号 | 阶段性领先不等于持续突破,时间线被拉长 |
| 2026 年初至 4 月 | 更新者普遍再次提前 | Anthropic 的快速进展带来新的能力信号 | 最新模型表现重新压缩了部分预测者的时间线 |
这里最容易误读的是“领先实验室”。
一个实验室在某个阶段跑得快,不等于它已经取得长期技术霸权。FutureSearch 讨论的是预测者如何接收信号,而不是给实验室排座次。
这也解释了为什么 AGI 时间线看起来总在变。模型突然跨过一批任务,预测就会被拉近;进展不连续,或者新能力没有顺利外推,预测又会回撤。
这不是预测者一定不专业。好的贝叶斯主义者本来就应该随证据更新。作者也强调,好的预测者不应事先知道自己下一步会朝哪个方向更新。
但这句话反过来也提醒我们:如果一个预测结论高度依赖最新模型表现,就不能把它当成铁板钉钉的时间表。
真正该用的是能力阈值,不是单个年份
对 AI 行业研究员来说,这篇文章的用处在方法上。
不要只问“某人预测 AGI 哪年到”。更该问三件事:他上一次怎么预测,这次为什么改,更新方向能不能被新证据解释。
对企业采购和投资观察者来说,动作要更具体。
如果你负责 AI 工具预算,单押一个 AGI 年份风险很高。更现实的做法是把采购和扩容绑在能力阈值上,比如:模型能否稳定完成长任务,能否替代一部分初级分析工作,推理成本是否降到团队能长期承担。
这会直接影响节奏。
信号不够强时,企业可以先做小范围试点,延后大规模迁移。信号变强时,再把客服、代码辅助、资料分析等流程逐步接入,而不是一次性押上组织结构。
对政策和投资研究也一样。更有用的不是“AGI 在哪一年”,而是区分几条情景线:能力快速外推、能力平台期、成本下降快但可靠性不足。不同情景对应的监管压力、资本开支和人才配置完全不同。
目前还看不清的是,某一次模型进展到底是短期冲刺,还是可持续斜率变化。FutureSearch 的材料能说明预测在摆动,但不能证明哪家实验室会长期领先,也不能证明某个年份就是终点。
接下来最该观察的变量很朴素:模型是否能把新能力稳定迁移到真实工作流,长任务表现是否连续提升,单位成本是否继续下降。只要这三件事没有同时变硬,AGI 时间线就仍然更像区间,而不是日期。
