Uber这件事最刺眼的地方,不是“用了AI”,而是“太能用”。

The Verge援引消息称,Uber据称在2026年前四个月就用完了全年AI预算。现在,Uber总裁兼COO Andrew Macdonald又在播客 Rapid Response 里补了一刀:Claude Code 这类工具的 token 消耗在上升,但公司还没有看到它和更多“有用消费者功能”之间的清晰关系。

这比“预算超了”更重要。

预算超了,可能是增长太快。高管开始问“到底交付了什么”,才说明企业AI从蜜月期进入报销单阶段。

几件事压缩看:

  • 发生了什么.Uber据称四个月用完全年AI预算,AI编程工具用量快速上升。
  • 新变量是什么.Macdonald说,很难把Claude Code的token消耗,直接对应到“多交付了25%的有用消费者功能”。
  • 钱有多大.Uber 2025年研发支出为34亿美元,同比增加9%。AI开销已经不是实验室小票。
  • 谁受影响.最先受影响的不是乘客,而是工程、产品、财务团队,以及明年还想扩AI预算的人。
  • 接下来观察什么.Uber会不会把token消耗按团队、项目、功能线拆开,和发布节奏、缺陷率、用户指标放在一张表上。

这里要补一句边界:Uber没有公开确认AI投资失败,也没有披露具体预算总额。Macdonald也留了余地——也许确实交付了更多东西,只是现在很难量化。

但这句话本身已经够重。

一家靠数据、调度、定价、转化率活着的平台公司,开始承认自己看不清AI投入和产品产出之间的线。这不是小公司的管理粗糙,这是企业AI预算最现实的断点。

编程助手成了刚需,也成了黑洞

旧的主线很清楚:AI编程助手正在从“效率玩具”变成研发刚需。

工程师写代码、补测试、查API、改脚本、做原型,越来越顺手。工具一旦进入日常工作流,就很难退回去。没人愿意从自动挡换回手摇拖拉机。

问题也在这里。

编程助手不像一台服务器,买了就在那里。它更像一只开着水龙头的机器:每一次补全、每一次上下文加载、每一次让模型读仓库、重构文件、解释错误,都在烧token。

工程师感知到的是“省事”。财务看到的是“账单”。

这两者之间原本靠一个朴素信念连接:开发者效率提高,产品自然交付更多。

Macdonald现在质疑的,正是这条链路。

Claude Code的token用量上涨,不等于乘客端多了更好用的功能,也不等于司机少等了几分钟,更不等于配送商户少掉单。中间隔着需求质量、代码评审、测试、发布、实验、合规、跨团队协调。

模型可以让一个人更快地产出代码,但不能自动让组织更快地产出产品。

很多公司现在最不愿面对的就是这句话。

token账单开始和人头预算抢位置

Uber CEO Dara Khosrowshahi此前提到,公司会通过减少新增招聘来消化AI投入上升。

这不是简单的“AI裁员”故事。更准确地说,AI工具费开始被放进人力预算的替代项里:少招一部分人,用模型、代码助手、自动化工具补上。

听上去合理。执行起来很硬。

人头成本虽然贵,但至少能拆:哪个团队、什么职责、服务哪个项目、绩效怎么评。一个人坐在那里,管理层知道他大概在干什么。

token成本更滑。

它可能用在真正有价值的重构上,也可能用在反复试错上;可能减少了测试时间,也可能制造了一堆看似能跑、实际没人敢合并的代码;可能帮高级工程师加速,也可能让初级工程师把不理解的东西复制进仓库。

这不是工具原罪,是激励设计的问题。

如果团队只被鼓励“多用AI”“覆盖率更高”“调用量增长”,那token消耗当然会好看。可产品结果不一定跟着走。用量指标很容易繁荣,交付指标很难撒谎。

上一轮云计算扩张也有类似历史回声。企业早年上云,大家先被弹性、速度、免运维打动,几年后FinOps才变成显学。因为账单终于大到不能靠信仰解释。

AI现在也到了这一刻。

不完全一样。云支出通常还能和流量、存储、交易量挂钩。生成式AI的token更细、更弹、更难归因。花钱动作极其清楚,省下的人月和多出来的功能却经常雾蒙蒙。

“天下熙熙,皆为利来。”放在企业AI里也一样。工具能留下,不是因为它先进,而是因为它能把利润、效率或产品体验落到可检查的地方。

最先被拷问的不是AI模型,而是管理能力

我不太买账一种乐观说法:AI提升是隐性的,所以暂时看不见很正常。

这话有一半对。

AI确实可能节省了很多后台成本,比如内部工具维护、客服辅助、测试生成、文档整理、排障时间。这些收益未必会马上变成消费者端的新按钮。Macdonald盯着“有用消费者功能”,视角可能偏窄。

但另一半也不能糊弄。

如果一家企业持续增加AI预算,却长期说不清它替代了什么、加速了什么、减少了什么错误、推高了什么指标,那就不是“收益隐性”,而是管理层没有建账。

AI预算接下来会更像云成本治理,而不是采购一个SaaS席位。

真正该问的不是“工程师喜不喜欢”,而是:

  • 哪些团队的token消耗最高?
  • 对应哪些项目和功能线?
  • 发布周期有没有缩短?
  • 缺陷率有没有下降?
  • 招聘减少后,交付有没有掉速?
  • 用户、司机、商户能不能感知到变化?

这些问题不好听,但有用。

企业AI采购最危险的阶段,不是完全没效果,而是效果散在各处,账单集中到财务。到那一步,人人都说自己受益,没人能证明收益归谁。

AI编程助手不会退潮,但预算神话会退潮

我仍然认为,AI编程工具会留在研发体系里。

原因很简单:它已经改变了工程师的手感。写样板代码、查陌生库、生成测试、理解旧代码,这些场景是真刚需。让开发团队完全不用,基本不现实。

但“会留下”和“无限扩预算”是两件事。

Uber这次真正露出的分水岭,是企业开始从“默认值得花”转向“证明你值得”。

这对AI工具厂商也不舒服。以前卖点是提升效率、释放创造力、让工程师更快。以后客户会问得更具体:你能不能减少多少缺陷?缩短多少PR周期?少招多少人还不掉交付?对消费者功能有没有可见影响?

这也是所有企业客户的现实功课。

AI不是不能贵。贵得有来由,就能进预算。贵得只剩一句“大家都在用”,迟早会被财务按住。

模型看着更强,产品反而可能更虚。不是因为模型没用,而是组织把“调用模型”误当成了“完成工作”。

Uber现在问的那条线,其实每家公司都该画:从token,到代码;从代码,到功能;从功能,到用户价值;从用户价值,到经营结果。

画不出来,万般智能,皆是账单。