Uber 当年退出自研无人车,很多人以为它把自动驾驶这张牌打丢了。现在看,它换了打法:车不造了,但想握住无人车最缺的东西——真实道路数据。

这件事来自 Uber CTO Praveen Neppalli Naga 在 TechCrunch StrictlyVC 活动上的披露。Uber 的长期设想,是让全球数百万网约车司机的车辆逐步装上传感器,变成自动驾驶公司的移动数据网络。

但这不是已经发生的事。当前 AV Labs 仍是 Uber 自营的小型传感器车队,和司机网络分开。司机车辆接入只是方向,不是现状。

Uber 要补的不是车,是真实场景数据

Uber 给出的判断很直接:自动驾驶的瓶颈,正在从底层技术转向真实场景数据。

模型不缺“道路”这个抽象概念。它缺的是旧金山某个学校路口、晚高峰某个转弯、雨天某条拥堵路段、临停车辆和行人混在一起时的具体经验。

这类数据最难买,也最难一次性采够。它有地点、时段、天气、道路习惯和城市治理的颗粒度。自动驾驶公司自己铺车采集,成本高,覆盖慢。

Uber 的优势正好在这里:它有车、有路线、有高频真实行程,还有足够多城市里的日常混乱。

变量现在是什么Uber 想推进到哪里
AV LabsUber 自营小型传感器车队更大的道路数据采集体系
司机车辆尚未大规模接入长期可能装上传感器参与采集
合作对象25 家自动驾驶伙伴更依赖 Uber 的数据和出行入口
AV cloud可查询、标注、训练的数据平台支持模型训练和 shadow mode 测试

这里的 AV cloud,不只是把视频和传感器数据堆在一起。按 Uber 的说法,它要能查询、标注,也能给模型训练使用。

shadow mode 更关键。车还是人类司机在开,自动驾驶模型在后台“影子运行”,判断如果由它接管会怎么做。它不控制车辆,却能吃到真实路况。

对自动驾驶公司来说,这很诱人。比自己在每个城市慢慢路测便宜,也更容易把罕见场景积累起来。

受影响最大的,不是普通乘客

这件事对普通乘客短期影响有限。不会因为这次披露,明天叫车体验就变成无人驾驶。

真正受影响的是两类人。

一类是自动驾驶和 AI 数据基础设施团队。它们要重新评估“自建采集车队”和“接入平台数据”的比例。如果 Uber 的 AV cloud 真的可用,一些团队可能会延后自建采集规模,把预算转向数据接入、标注流程和 shadow mode 评估。

这不是小选择。数据来源一旦依赖平台,模型迭代速度可能更快,但议价权也会外移。今天省下采集成本,明天可能要接受平台的接口、规则和合作排序。

另一类是网约车行业观察者,尤其是司机权益和平台监管关注者。司机如果参与传感器采集,就不只是接单者,也成了数据生产者。

那补偿怎么算?按里程、按时长、按城市稀缺路况,还是打包进平台激励?如果只是象征性补贴,司机等于用自己的车、路线和劳动时间,帮平台沉淀下一代自动驾驶资产。

这就是反常点:Uber 过去依赖人类司机建立出行网络,现在可能用这张网络训练替代司机的系统。

商业上很顺。利益分配上很刺。

“民主化数据”要听一半,另一半看权力

Naga 表示,Uber 的目标不是靠这些数据赚钱,而是“民主化”自动驾驶数据。这个说法不能全盘否定。

很多 AV 公司确实采不起足够密、足够真实的城市道路数据。Uber 如果开放一部分能力,能降低进入门槛,也能让更多模型在真实场景里被检验。

但平台一旦掌握入口,就很难只是公益仓库。

Uber 已有 25 家自动驾驶合作伙伴,也在建设 AV cloud。它不需要直接出售数据,仍然可以用数据换合作、换优先接入、换商业条款,甚至换未来车队进入 Uber 网络时的位置。

“天下熙熙,皆为利来。”这句话放在这里不刻薄。平台的控制力,从来不只来自收费按钮,也来自谁能被看见、谁能被匹配、谁能被训练。

监管会盯得更细。司机车辆装传感器,采到的未必只有车道线和红绿灯,还可能包括路人、车牌、街景、乘客上下车地点,以及特定社区的活动规律。

州级监管会问几个很硬的问题:这些传感器算什么设备?司机和乘客是否需要明确同意?数据共享的边界在哪里?谁能查询、谁能标注、谁能用于模型训练?

接下来最该看的,不是 Uber 讲了多少“民主化”。要看三件事。

  • 司机车辆接入 AV Labs 时,是否有清楚的补偿规则。
  • AV cloud 的数据权限,是否区分训练、测试、查询和商业合作。
  • 州级监管是否把传感器采集、隐私告知和数据共享纳入明确框架。

这几个条件不清楚,Uber 的数据网络越大,争议越大。

平台经济的老故事又绕回来了。先把分散的人和资产组织起来,再把组织过程中的数据沉淀下来,最后用数据提高议价权。铁路、电网、报业、外卖、网约车,都有类似影子。不完全一样,但权力结构很熟。

所以这不是 Uber 重返造车。它更像是在自动驾驶时代提前占一个入口:车可以由别人造,模型可以由别人训,但路上的经验最好从它这里过一遍。

自动驾驶竞争正在从“谁的车能跑”转向“谁能持续拿到稀缺道路经验”。模型越强,越离不开现实世界那些脏、碎、重复、带城市脾气的数据。

谁控制这些数据,谁就在下一轮交通网络里多了一只手。