TechCrunch 5 月 29 日发布一份 AI glossary,并称会随行业变化持续更新。这不是一次性新闻爆料,而是一份 living document:它试图把 AGI、AI agent、LLM、RAG、RLHF、幻觉、推理、微调、蒸馏等常见词,用非技术读者能理解的语言重新讲清。
这件事真正重要的地方,不是 TechCrunch 又做了一个知识页面,而是 AI 行业正在把大量尚未稳定的概念包装成日常话术。普通用户、企业采购和非 AI 岗位的科技从业者,常常在会议里听懂了每个字,却没把握这些词到底指什么。术语表的价值,就在于把“听起来很先进”拆回“到底能做什么、不能保证什么”。
TechCrunch 做的是术语校准,不是技术判决
原文最有用的处理,是没有把 AGI 写成一个已经抵达的终点。它列出 OpenAI、OpenAI charter 和 Google DeepMind 对 AGI 的不同说法:有的强调“多数经济价值工作”,有的强调“多数认知任务”,Sam Altman 也曾用“可雇佣的中位数人类同事”作类比。结论很清楚:AGI 仍是一个边界模糊的词,不是行业公认的计量单位。
AI agent 也类似。它通常指能代表用户连续执行任务的系统,比如报销、订票、订餐,甚至写代码和维护代码。但当前行业里的 agent,更多是“朝自主多步骤任务演进的产品形态”,并不等于已经能稳定、完全自主地处理复杂工作。TechCrunch 特意提到,相关基础设施还在搭建,这一点比许多产品演示更接近现实。
可以把几个高频词先放在同一张表里看:
| 术语 | 更准确的理解 | 容易误用的地方 |
|---|---|---|
| AGI | 对“通用智能”的目标性描述 | 当成已经实现或已有统一标准 |
| AI agent | 可调用工具、执行多步骤任务的 AI 系统 | 当成不需要人工监督的全自动员工 |
| LLM | 通过大量文本学习语言模式的大模型 | 误以为它天然理解事实与因果 |
| 推理 inference | 模型被运行、生成输出的过程 | 和“逻辑推理能力”混为一谈 |
| 微调 fine-tuning | 在已有模型上用特定数据继续训练 | 误以为能彻底消除模型缺陷 |
| 蒸馏 distillation | 用大模型输出训练更小模型 | 忽略数据来源、服务条款和能力损失 |
最容易混淆的是模型生命周期
对非专业读者来说,AI 术语最大的坑常常不在某个单词,而在生命周期混乱。训练、推理、微调、蒸馏听起来都像“让模型变聪明”,实际指向不同环节。
训练是模型学习数据模式的过程,成本高,依赖数据和算力。推理是把训练好的模型跑起来,回答问题或生成内容。微调是在已有模型基础上补一段领域数据,让它更适合客服、医疗问答、法务检索这类窄任务。蒸馏则像“老师带学生”:用大模型的输出去训练小模型,换取更低成本和更快速度,但通常要接受能力折损和合规边界。
这个区分会直接影响企业决策。采购一个 AI 产品时,如果供应商说“我们训练了行业模型”,和“我们基于通用大模型做了微调”,投入、壁垒和风险完全不同。前者可能意味着更重的数据、算力和长期维护;后者落地更快,但对底座模型和外部接口依赖更强。单看演示效果,很难判断长期可控性。
历史上,科技行业不止一次用术语制造理解落差。云计算早期,“私有云”“混合云”“托管机房”也被混着讲,直到采购、合规和运维成本把概念重新压实。今天 AI 术语经历的是类似过程,只是速度更快,参与者更多。
幻觉、链式思维和 RAG 不是魔法开关
TechCrunch 对“幻觉”的解释足够直白:模型编造了错误信息。这不是小毛病。医疗建议、法律判断、财务分析里,一次看似流畅的错误回答,可能比一个明确的“不知道”更危险。
链式思维常被描述为让模型分步骤思考。它确实可能提升数学、逻辑、代码任务的正确率,但代价是响应更慢,也不保证每一步都可靠。RAG,即检索增强生成,则让模型在回答前参考外部资料,常用于降低知识过期和胡编风险。但它依赖检索源质量、切片方式和引用约束;如果召回的是错资料,模型依然会把错误包装得很像答案。
最该受影响的,是两类人。关注 AI 的普通用户需要学会判断:一个回答写得顺,并不等于事实稳。科技从业者和企业采购则要把术语翻译成验收条件:是否能追溯资料来源、是否有人审、错误率如何记录、出了事故谁负责。
接下来真正该观察的,不是哪家公司把这些词讲得更漂亮,而是行业会不会把术语落到可测试的承诺上。AGI 和 agent 这种词短期内仍会漂移;训练、推理、微调、蒸馏、RAG 这类工程概念,则应当被写进产品说明、合同边界和内部评估表。术语一旦进入预算,就不能只停在宣传页。
