GitHub Copilot 从 2021 年技术预览走到企业工具,ChatGPT、Claude、Cursor 也早就进了开发流程。代码补全、测试样板、文档摘要、设计草稿,都在变便宜。
麻烦也在这里。
过去团队看一个工程师,至少还能从代码、评审、排障里摸到一点能力质地。现在 AI 能把答案包装得很完整,语法顺,结构齐,语气稳。一个人到底是在借工具加速理解,还是在转述模型答案,没那么容易看出来了。
软件工程这个案例,把原本偏抽象的判断落到了更硬的验货现场:LLM 击穿的不是写作,也不只是编程,而是知识工作的验货方式。
发生了什么:AI 把工程师分成两种人
一篇面向软件工程行业的观点文章提出了一个很直接的分法:
| 类型 | 怎么用 AI | 短期表现 | 长期后果 |
|---|---|---|---|
| 加速理解的人 | 让 AI 总结文档、列测试场景、找失败模式,再自己验证 | 调研更快,讨论更聚焦 | 判断力被放大 |
| 回避理解的人 | 把问题丢给模型,拿答案直接提交或汇报 | 输出漂亮,像是效率提高 | 调试直觉和系统感变弱 |
这不是“工程师该不该用 AI”的老问题。那个阶段已经过去了。
真正的问题是:团队还能不能区分“产出多”和“判断好”。
AI 可以生成解释,生成方案,生成状态更新。它尤其擅长制造一种成熟感。文档像文档,代码像代码,汇报像汇报。但软件工程最贵的部分,从来不是把语法写对,而是在约束不清、需求变化、系统复杂时做取舍。
这条新线索补强的地方正在这里:它把“知识工作仿真化”从泛泛的内容生产,推进到了工程交付。写作里,AI 让文章看起来像文章;编程里,AI 让方案看起来像方案。两者背后是同一个问题:看起来会,不等于真会。
为什么重要:输出变便宜,理解反而更贵
过去很多组织把工程能力简化成代码产量。谁写得多,谁回得快,谁文档齐,谁看起来就强。
AI 把这个粗糙指标打穿了。
如果软件工程只是生产可运行代码,生成式 AI 确实会压低一大批基础编码工作的稀缺性。补全函数、写样板测试、改注释、整理接口文档,这些活会越来越像水电煤。不是没有价值,但不再稀缺。
真正难的部分还在:
- 这个需求是不是值得做;
- 抽象是不是太早;
- 依赖是不是危险;
- 上线后哪里可能炸;
- 模型给出的答案,边界在哪里。
这里最容易被低估的是上下文。
一个模型可以生成漂亮的重构建议,但它未必知道某个内部服务的历史债务、灰度规则、合规约束和团队承诺。能把这些隐性条件补进问题里,再校正模型答案的人,才是在使用 AI。不能解释答案边界的人,只是在搬运 AI。
这和低代码、自动化测试、CI/CD、云服务的历史有点像。工具每次进步,都会砍掉一部分手工劳动。但最后拉开差距的,仍然是团队是否理解系统。
不完全一样的是,AI 更会伪装。
低代码生成的东西,粗糙处常常一眼能看出来。AI 生成的东西,表面更顺。它不只提高产能,还提高了浅层产出的欺骗性。
“知其然,不知其所以然”,放在今天不是书生气的批评,而是工程风险。
谁受影响:新人和管理者最先承压
受影响最直接的,是早期工程师。
学习编程真正痛苦的部分,恰恰是能力形成的部分:定位 bug,追根因,拆问题,解释为什么某段代码在真实环境里失效。如果每个难题都由 AI 直接给答案,新人一两个季度内可能显得更快,但调试直觉没长出来。
这不是要求新人少用 AI。那很不现实,也没必要。
更好的用法是让 AI 给线索,而不是给结论:
- 让它列可能原因;
- 让它设计对照测试;
- 让它指出边界条件;
- 让它解释几种方案的代价;
- 然后自己验证。
机械劳动可以省。真功夫不能省。
管理者压力也会变大。
如果绩效仍然盯着文档是否完整、代码是否迅速堆出来、周报是否体面,组织就会奖励最会包装模型输出的人。真正能发现风险的人,反而可能显得“不够快”。
这才是最危险的激励设计。
强工程师会被迫花更多时间替浅层产出兜底。评审会变长,排障会变脏,线上事故会暴露那些本该在设计阶段被问出来的问题。组织表面提速,内部知识质量变薄。
这不是工具问题,是验货问题。
我的判断:AI 时代最稀缺的是可追责的理解
我不太买账一种说法:AI 会让普通工程师都变成高级工程师。
更可能发生的是,AI 让普通输出更像高级输出。差距不会消失,只会换地方出现。
以前差距体现在“你能不能写出来”。现在差距体现在“你能不能证明你理解”。
这对组织是一次很现实的考试。面试不能只看候选人能不能用 AI 快速搭一个 demo,要看他能不能解释取舍。评审不能只看方案是否完整,要看他能不能指出失败模式。绩效不能只看交付速度,要看他有没有减少未来的维护债。
速度可以买。判断买不来。
历史上每一种生产工具都会制造类似错觉。铁路让运输变快,但不会替公司判断运什么货;电报让消息变快,但不会替将军判断战场;搜索引擎让资料变近,但不会替研究者建立问题。
AI 也一样。它把知识工作的搬运成本压到很低,却没有自动解决判断、责任和上下文。
“天下熙熙,皆为利来。”企业拥抱 AI,当然是因为它能降本、提速、压缩流程。这没什么可羞于承认的。问题在于,如果组织只拿 AI 去榨产量,而不重建验货方式,最后省下的是人力成本,欠下的是系统债。
接下来真正该看的,不是谁又接入了哪个模型,而是几个更硬的信号:
- 代码评审是否开始要求解释 AI 输出的边界;
- 新人培养是否保留调试和推理训练;
- 绩效是否能识别发现风险的人;
- 团队是否允许工程师对“看起来完整”的方案说不。
如果这些没变,AI 只会让组织更快地产生半懂不懂的产物。
模型看着更强,产品反而可能更虚。
这就是我对这轮 AI 进入知识工作的基本判断:它没有取消专业能力,它取消的是很多伪装成专业能力的表面动作。谁能验货,谁才真的值钱。
