AutoScout24 Group 这次给出的数字很亮:部分项目开发周期,从 2-3 周缩短到 2-3 天。

但这句话要带着刹车读。原文说的是 select projects,不是全公司普遍提速十倍。它还是一篇 OpenAI 客户案例,天然有营销口径,不能当独立评测报告。

更有价值的不是这个数字,而是 AutoScout24 把 AI 放到了哪里。它没有停在“给工程师发一个编程助手账号”,而是把 Codex 塞进代码评审、重构、文档和事故复盘这些真实工程节点里。

AutoScout24 做了什么:全员一层,工程一层

AutoScout24 Group 是泛欧洲和加拿大在线汽车市场,旗下包括欧洲的 AutoScout24 和加拿大的 AutoTrader.ca。它月活超过 3000 万,车辆列表超过 200 万,经销商伙伴约 4.5 万。

这类平台表面是汽车交易,底层是复杂软件系统。搜索、推荐、库存、广告、经销商工具、用户转化、遗留系统迁移,都要工程团队长期扛着。

这次 AI 推广大致是两层:ChatGPT 面向约 2000 名员工,Codex 面向约 1000 名 builder 员工,包括工程、数据和产品人员。

项目覆盖对象主要用途需要打折看的地方
ChatGPT约 2000 名员工全员 AI 使用、非技术岗位原型验证提升 AI 素养,不等于直接提升工程产能
Codex约 1000 名 builder 员工代码审查、重构、文档、事故复盘依赖上下文、测试、评审和责任机制
评估过程3 个月跨团队评估看可用性、流程兼容性、生产率、代码质量仍来自厂商客户案例口径
官方结果select projects部分项目从 2-3 周缩到 2-3 天不能写成全公司普遍提速

它还搭了一个跨职能的 AI Champions 网络,用来连接中心方向和一线反馈。

这个细节比“用了 Codex”更重要。很多公司的 AI 推广死在中间层:老板买工具,员工试两天,群里晒几个 prompt,然后大家回到原来的 Jira、PR、会议和救火节奏里。

工具还在,组织没动。

亮点不是 Codex,而是它进入了工程制度

我更在意两个动作。

一个是双层推广。ChatGPT 解决全员 AI 使用能力,Codex 解决软件交付里的具体瓶颈。前者让非技术岗位能更快做原型、写材料、验证想法;后者才接近研发产能。

另一个是嵌入工作流。自动 PR review、大规模重构、技术文档、事故复盘,都不是炫技场景。它们是软件组织每天重复发生的协作节点。

AI 编程工具最容易制造一种错觉:能写代码,就像能替人交付。

真实工程不是写代码竞速赛。它有依赖,有历史债,有上线风险,有责任归属。代码能生成,不代表系统能交付。

这也是技术管理者该拿走的部分:不要急着把预算花在“全员开通”上。更现实的动作,是先挑一个高频流程改造,比如 PR review、测试补全、遗留代码重构或事故复盘文档。

然后看四个指标:

观察变量该问的问题
采用率工程师是每天用,还是只在试点周用
返工率AI 产出有没有增加 review 负担
交付周期是否只在少数项目变快,还是能稳定复制
责任边界AI 生成、人工修改、合入主干,谁负责

产品和数据团队也一样。非技术岗位可以用 AI 做原型验证,但不要把原型当需求定稿。原型越快,越需要产品、工程、数据把边界说清楚。

否则速度会变成新摩擦。

分水岭在组织执行,不在采购清单

我不太买账“一上线 AI 工具,研发效率自然暴涨”的叙事。它太省事,也太像卖方话术。

真正难的是几个不体面的细节。

AI review 给了建议,人类评审还看不看?Codex 帮忙重构,测试覆盖够不够?事故复盘由 AI 起草,团队会不会只留下漂亮废话?

这些问题不性感,但它们决定 AI 是生产力,还是噪音源。

这里有一点像当年的 DevOps。CI/CD 工具本身不稀奇,难的是团队愿不愿意改发布流程、值班制度、回滚机制和质量责任。不完全一样,但权力结构很像:工具只是入口,真正卡住的是组织愿不愿意改规矩。

“工欲善其事,必先利其器。”这句话放到 AI 编程时代,只说了一半。器利之后,还要改工法。

AutoScout24 这次少见地做对了一个方向:没有把 AI 当外挂,而是让它进入 PR、文档、复盘、原型这些环节。这样才有机会把演示效率压进组织产能。

但代价还没结算完。

接下来最该观察的,不是它还会不会继续买更多 AI 工具,而是三件事:select projects 的提速能不能扩到更多团队;AI review 有没有降低质量风险,而不是转移给人工兜底;AI Champions 能不能持续把一线问题带回流程设计。

如果这三件事做不到,2-3 天的故事就只是一个漂亮样板间。

如果做到了,它说明的也不是 Codex 单点胜利,而是企业开始学会重新分配人和机器的工作边界。

真正的提效,从来不是让机器多写几行代码,而是让组织少浪费几轮无效协作。