AI 没有击穿写作和编程，它击穿了知识工作的验货方式

核心摘要 Summary

AI 正在把软件工程里的分水岭暴露出来：会不会生成代码已经不稀缺，能不能解释、校验和负责才值钱。
新线索把“知识工作仿真化”这个判断落到了工程现场：输出越来越像真的，组织却更难判断一个人到底懂不懂。

GitHub Copilot 从 2021 年技术预览走到企业工具，ChatGPT、Claude、Cursor 也早就进了开发流程。代码补全、测试样板、文档摘要、设计草稿，都在变便宜。

麻烦也在这里。

过去团队看一个工程师，至少还能从代码、评审、排障里摸到一点能力质地。现在 AI 能把答案包装得很完整，语法顺，结构齐，语气稳。一个人到底是在借工具加速理解，还是在转述模型答案，没那么容易看出来了。

软件工程这个案例，把原本偏抽象的判断落到了更硬的验货现场：LLM 击穿的不是写作，也不只是编程，而是知识工作的验货方式。

发生了什么：AI 把工程师分成两种人

一篇面向软件工程行业的观点文章提出了一个很直接的分法：

类型	怎么用 AI	短期表现	长期后果
加速理解的人	让 AI 总结文档、列测试场景、找失败模式，再自己验证	调研更快，讨论更聚焦	判断力被放大
回避理解的人	把问题丢给模型，拿答案直接提交或汇报	输出漂亮，像是效率提高	调试直觉和系统感变弱

这不是“工程师该不该用 AI”的老问题。那个阶段已经过去了。

真正的问题是：团队还能不能区分“产出多”和“判断好”。

AI 可以生成解释，生成方案，生成状态更新。它尤其擅长制造一种成熟感。文档像文档，代码像代码，汇报像汇报。但软件工程最贵的部分，从来不是把语法写对，而是在约束不清、需求变化、系统复杂时做取舍。

这条新线索补强的地方正在这里：它把“知识工作仿真化”从泛泛的内容生产，推进到了工程交付。写作里，AI 让文章看起来像文章；编程里，AI 让方案看起来像方案。两者背后是同一个问题：看起来会，不等于真会。

为什么重要：输出变便宜，理解反而更贵

过去很多组织把工程能力简化成代码产量。谁写得多，谁回得快，谁文档齐，谁看起来就强。

AI 把这个粗糙指标打穿了。

如果软件工程只是生产可运行代码，生成式 AI 确实会压低一大批基础编码工作的稀缺性。补全函数、写样板测试、改注释、整理接口文档，这些活会越来越像水电煤。不是没有价值，但不再稀缺。

真正难的部分还在：

这个需求是不是值得做；
抽象是不是太早；
依赖是不是危险；
上线后哪里可能炸；
模型给出的答案，边界在哪里。

这里最容易被低估的是上下文。

一个模型可以生成漂亮的重构建议，但它未必知道某个内部服务的历史债务、灰度规则、合规约束和团队承诺。能把这些隐性条件补进问题里，再校正模型答案的人，才是在使用 AI。不能解释答案边界的人，只是在搬运 AI。

这和低代码、自动化测试、CI/CD、云服务的历史有点像。工具每次进步，都会砍掉一部分手工劳动。但最后拉开差距的，仍然是团队是否理解系统。

不完全一样的是，AI 更会伪装。

低代码生成的东西，粗糙处常常一眼能看出来。AI 生成的东西，表面更顺。它不只提高产能，还提高了浅层产出的欺骗性。

“知其然，不知其所以然”，放在今天不是书生气的批评，而是工程风险。

谁受影响：新人和管理者最先承压

受影响最直接的，是早期工程师。

学习编程真正痛苦的部分，恰恰是能力形成的部分：定位 bug，追根因，拆问题，解释为什么某段代码在真实环境里失效。如果每个难题都由 AI 直接给答案，新人一两个季度内可能显得更快，但调试直觉没长出来。

这不是要求新人少用 AI。那很不现实，也没必要。

更好的用法是让 AI 给线索，而不是给结论：

让它列可能原因；
让它设计对照测试；
让它指出边界条件；
让它解释几种方案的代价；
然后自己验证。

机械劳动可以省。真功夫不能省。

管理者压力也会变大。

如果绩效仍然盯着文档是否完整、代码是否迅速堆出来、周报是否体面，组织就会奖励最会包装模型输出的人。真正能发现风险的人，反而可能显得“不够快”。

这才是最危险的激励设计。

强工程师会被迫花更多时间替浅层产出兜底。评审会变长，排障会变脏，线上事故会暴露那些本该在设计阶段被问出来的问题。组织表面提速，内部知识质量变薄。

这不是工具问题，是验货问题。

我的判断：AI 时代最稀缺的是可追责的理解

我不太买账一种说法：AI 会让普通工程师都变成高级工程师。

更可能发生的是，AI 让普通输出更像高级输出。差距不会消失，只会换地方出现。

以前差距体现在“你能不能写出来”。现在差距体现在“你能不能证明你理解”。

这对组织是一次很现实的考试。面试不能只看候选人能不能用 AI 快速搭一个 demo，要看他能不能解释取舍。评审不能只看方案是否完整，要看他能不能指出失败模式。绩效不能只看交付速度，要看他有没有减少未来的维护债。

速度可以买。判断买不来。

历史上每一种生产工具都会制造类似错觉。铁路让运输变快，但不会替公司判断运什么货；电报让消息变快，但不会替将军判断战场；搜索引擎让资料变近，但不会替研究者建立问题。

AI 也一样。它把知识工作的搬运成本压到很低，却没有自动解决判断、责任和上下文。

“天下熙熙，皆为利来。”企业拥抱 AI，当然是因为它能降本、提速、压缩流程。这没什么可羞于承认的。问题在于，如果组织只拿 AI 去榨产量，而不重建验货方式，最后省下的是人力成本，欠下的是系统债。

接下来真正该看的，不是谁又接入了哪个模型，而是几个更硬的信号：

代码评审是否开始要求解释 AI 输出的边界；
新人培养是否保留调试和推理训练；
绩效是否能识别发现风险的人；
团队是否允许工程师对“看起来完整”的方案说不。

如果这些没变，AI 只会让组织更快地产生半懂不懂的产物。

模型看着更强，产品反而可能更虚。

这就是我对这轮 AI 进入知识工作的基本判断：它没有取消专业能力，它取消的是很多伪装成专业能力的表面动作。谁能验货，谁才真的值钱。

AI 没有击穿写作和编程，它击穿了知识工作的验货方式

验货失灵

分水岭

加速理解

回避理解

输出贬值

理解升值

伪装增强

压力对象

新人断层

激励错位

组织重构

评审改向

绩效改向

核心判断

AI可代劳

真会更贵

发生了什么：AI 把工程师分成两种人

为什么重要：输出变便宜，理解反而更贵

谁受影响：新人和管理者最先承压

我的判断：AI 时代最稀缺的是可追责的理解