Uber四个月烧完AI预算后，高管开始问：这些token到底换来了什么？

核心摘要 Summary

Uber据称在2026年前四个月用完全年AI预算后，总裁兼COO Andrew Macdonald又把问题挑明：Claude Code等工具的token消耗在涨，但很难证明它带来了更多有用的消费者功能。
旧问题是AI编程助手击穿预算表，新变化是管理层不再只看工程师爱不爱用，而开始追问钱、功能和人效之间的硬连接。

Uber这件事最刺眼的地方，不是“用了AI”，而是“太能用”。

The Verge援引消息称，Uber据称在2026年前四个月就用完了全年AI预算。现在，Uber总裁兼COO Andrew Macdonald又在播客 Rapid Response 里补了一刀：Claude Code 这类工具的 token 消耗在上升，但公司还没有看到它和更多“有用消费者功能”之间的清晰关系。

这比“预算超了”更重要。

预算超了，可能是增长太快。高管开始问“到底交付了什么”，才说明企业AI从蜜月期进入报销单阶段。

几件事压缩看：

发生了什么.Uber据称四个月用完全年AI预算，AI编程工具用量快速上升。
新变量是什么.Macdonald说，很难把Claude Code的token消耗，直接对应到“多交付了25%的有用消费者功能”。
钱有多大.Uber 2025年研发支出为34亿美元，同比增加9%。AI开销已经不是实验室小票。
谁受影响.最先受影响的不是乘客，而是工程、产品、财务团队，以及明年还想扩AI预算的人。
接下来观察什么.Uber会不会把token消耗按团队、项目、功能线拆开，和发布节奏、缺陷率、用户指标放在一张表上。

这里要补一句边界：Uber没有公开确认AI投资失败，也没有披露具体预算总额。Macdonald也留了余地——也许确实交付了更多东西，只是现在很难量化。

但这句话本身已经够重。

一家靠数据、调度、定价、转化率活着的平台公司，开始承认自己看不清AI投入和产品产出之间的线。这不是小公司的管理粗糙，这是企业AI预算最现实的断点。

编程助手成了刚需，也成了黑洞

旧的主线很清楚：AI编程助手正在从“效率玩具”变成研发刚需。

工程师写代码、补测试、查API、改脚本、做原型，越来越顺手。工具一旦进入日常工作流，就很难退回去。没人愿意从自动挡换回手摇拖拉机。

问题也在这里。

编程助手不像一台服务器，买了就在那里。它更像一只开着水龙头的机器：每一次补全、每一次上下文加载、每一次让模型读仓库、重构文件、解释错误，都在烧token。

工程师感知到的是“省事”。财务看到的是“账单”。

这两者之间原本靠一个朴素信念连接：开发者效率提高，产品自然交付更多。

Macdonald现在质疑的，正是这条链路。

Claude Code的token用量上涨，不等于乘客端多了更好用的功能，也不等于司机少等了几分钟，更不等于配送商户少掉单。中间隔着需求质量、代码评审、测试、发布、实验、合规、跨团队协调。

模型可以让一个人更快地产出代码，但不能自动让组织更快地产出产品。

很多公司现在最不愿面对的就是这句话。

token账单开始和人头预算抢位置

Uber CEO Dara Khosrowshahi此前提到，公司会通过减少新增招聘来消化AI投入上升。

这不是简单的“AI裁员”故事。更准确地说，AI工具费开始被放进人力预算的替代项里：少招一部分人，用模型、代码助手、自动化工具补上。

听上去合理。执行起来很硬。

人头成本虽然贵，但至少能拆：哪个团队、什么职责、服务哪个项目、绩效怎么评。一个人坐在那里，管理层知道他大概在干什么。

token成本更滑。

它可能用在真正有价值的重构上，也可能用在反复试错上；可能减少了测试时间，也可能制造了一堆看似能跑、实际没人敢合并的代码；可能帮高级工程师加速，也可能让初级工程师把不理解的东西复制进仓库。

这不是工具原罪，是激励设计的问题。

如果团队只被鼓励“多用AI”“覆盖率更高”“调用量增长”，那token消耗当然会好看。可产品结果不一定跟着走。用量指标很容易繁荣，交付指标很难撒谎。

上一轮云计算扩张也有类似历史回声。企业早年上云，大家先被弹性、速度、免运维打动，几年后FinOps才变成显学。因为账单终于大到不能靠信仰解释。

AI现在也到了这一刻。

不完全一样。云支出通常还能和流量、存储、交易量挂钩。生成式AI的token更细、更弹、更难归因。花钱动作极其清楚，省下的人月和多出来的功能却经常雾蒙蒙。

“天下熙熙，皆为利来。”放在企业AI里也一样。工具能留下，不是因为它先进，而是因为它能把利润、效率或产品体验落到可检查的地方。

最先被拷问的不是AI模型，而是管理能力

我不太买账一种乐观说法：AI提升是隐性的，所以暂时看不见很正常。

这话有一半对。

AI确实可能节省了很多后台成本，比如内部工具维护、客服辅助、测试生成、文档整理、排障时间。这些收益未必会马上变成消费者端的新按钮。Macdonald盯着“有用消费者功能”，视角可能偏窄。

但另一半也不能糊弄。

如果一家企业持续增加AI预算，却长期说不清它替代了什么、加速了什么、减少了什么错误、推高了什么指标，那就不是“收益隐性”，而是管理层没有建账。

AI预算接下来会更像云成本治理，而不是采购一个SaaS席位。

真正该问的不是“工程师喜不喜欢”，而是：

哪些团队的token消耗最高？
对应哪些项目和功能线？
发布周期有没有缩短？
缺陷率有没有下降？
招聘减少后，交付有没有掉速？
用户、司机、商户能不能感知到变化？

这些问题不好听，但有用。

企业AI采购最危险的阶段，不是完全没效果，而是效果散在各处，账单集中到财务。到那一步，人人都说自己受益，没人能证明收益归谁。

AI编程助手不会退潮，但预算神话会退潮

我仍然认为，AI编程工具会留在研发体系里。

原因很简单：它已经改变了工程师的手感。写样板代码、查陌生库、生成测试、理解旧代码，这些场景是真刚需。让开发团队完全不用，基本不现实。

但“会留下”和“无限扩预算”是两件事。

Uber这次真正露出的分水岭，是企业开始从“默认值得花”转向“证明你值得”。

这对AI工具厂商也不舒服。以前卖点是提升效率、释放创造力、让工程师更快。以后客户会问得更具体：你能不能减少多少缺陷？缩短多少PR周期？少招多少人还不掉交付？对消费者功能有没有可见影响？

这也是所有企业客户的现实功课。

AI不是不能贵。贵得有来由，就能进预算。贵得只剩一句“大家都在用”，迟早会被财务按住。

模型看着更强，产品反而可能更虚。不是因为模型没用，而是组织把“调用模型”误当成了“完成工作”。

Uber现在问的那条线，其实每家公司都该画：从token，到代码；从代码，到功能；从功能，到用户价值；从用户价值，到经营结果。

画不出来，万般智能，皆是账单。

Uber四个月烧完AI预算后，高管开始问：这些token到底换来了什么？

Uber追问AI账

预算烧快

研发基数

披露边界

产出断链

中间环节

消费者价值

成本挤压

少招消化

归因更难

治理转向

指标重排

类比云成本

预算退潮

厂商承压

后续变量

编程助手成了刚需，也成了黑洞

token账单开始和人头预算抢位置

最先被拷问的不是AI模型，而是管理能力

AI编程助手不会退潮，但预算神话会退潮