据404 Media报道,Google正在邀请部分Play Store安卓开发者加入一个名为“confidential content offer pilot”的项目,付费获取他们的非公开代码库访问权。消息来自404 Media获得的一封邮件,收件人是一款拥有数百万下载量安卓应用的开发者;该开发者因担心遭到Google报复而匿名。
这件事的关键不在于Google突然开始“买代码”,而在于AI编程工具竞争进入了更现实的一层:公开互联网代码、开源仓库和论坛内容未必够用了。Google邮件称,相关代码将用于改进其开发者工具和产品;邮件正文没有直接提AI,但跳转链接指向Google关于付费获取非公开内容以改进AI产品的页面。
Google要的是生产代码,也要废弃项目归档
邮件中的购买对象并不限于正在运行的应用代码。Google明确提到,现有生产代码库、原型项目、已不再使用的副项目归档,都可能有价值。
对安卓开发者来说,这不是一次常规的SDK合作,也不是开源贡献。它更像是一笔数据授权交易:开发者交出代码访问权,Google支付费用,并把这些真实代码用于产品改进、复杂逻辑理解、代码评测和基准测试等场景。
| 项目 | Google邮件中的说法 | 对开发者的含义 |
|---|---|---|
| 购买对象 | 生产代码库、原型、废弃项目归档 | 不只看公开代码,也看真实工程遗留物 |
| 授权方式 | 非独占授权 | Google不是买断,开发者仍可继续使用和变现 |
| IP归属 | 开发者保留100%知识产权 | 应用和代码所有权不转移 |
| 用途表述 | 改进Google开发者工具和产品 | 具体是否进入某个模型,目前不能确认 |
这里最容易被误读的是“买代码”等于“收走代码”。按邮件说法,Google承诺的是非独占授权,开发者保留IP,也可以在其他地方继续变现数据。真正的问题不是所有权,而是代码一旦进入大公司内部训练、评测或产品改进流程,开发者很难追踪它后续产生了什么价值。
邮件不写AI,但链接把意图说得更清楚
404 Media看到的邮件正文没有直接写“人工智能”或“训练Gemini”。因此,不能把它写成Google已经确认用这些代码训练某个具体AI编程模型。
但邮件中的链接指向Google AI网站一篇关于“partnerships to improve our AI products”的页面。该页面称,除公开可获得的数据外,Google正在寻求付费获取多种格式的非公开内容,用于改进AI产品。
这个细节让项目的性质更清楚:Google至少在探索一种更正式的数据采购路径。过去AI公司大量依赖网页抓取、开源代码、问答社区和公开文档;现在,优质、真实、带有工程复杂度的非公开内容开始被单独标价。
历史上已经有类似动作。Google曾向Reddit支付约6000万美元,以获取其站点内容用于AI训练。那笔交易针对的是社区文本和讨论;这一次,如果对象是安卓应用代码库,价值就更贴近AI编程工具的短板:真实项目里有依赖冲突、历史包袱、业务逻辑和不完美的工程决策,这些往往不是漂亮的开源样例能覆盖的。
AI编程工具的竞争,逼平台去找“真实代码”
Google在AI编程助手上的压力并不小。Anthropic的Claude Code已经成为开发者圈内讨论度很高的工具,Microsoft则借GitHub Copilot较早进入企业和个人开发流程。Google有Gemini,也有Android Studio、Firebase、Cloud等开发者产品,但在“写代码、改代码、读大型工程”的口碑上,它面对的是更直接的工具竞争。
真实代码库之所以值钱,是因为它能帮助模型和工具理解“软件实际上怎么被维护”。公开代码很多,但高质量、可授权、带真实产品上下文的代码并不无限。更重要的是,越来越多网站、平台和内容方开始限制抓取,AI公司继续只靠公开互联网吃老本,成本会升高,争议也会增加。
受影响最直接的是安卓开发者。收到邀请的人可能会把这当作一笔额外收入,但他们要判断三件事:代码里是否包含第三方授权限制,是否混有用户数据或商业机密,合同是否允许Google用于训练、评测或其他产品场景。对中小团队来说,这不是点一下同意就能结束的事,最好让法务或至少熟悉开源许可证的人看过条款。
接下来最该看三个变量:Google是否扩大试点范围;合同是否明确写入AI训练、模型评测或产品使用边界;开发者能否获得足够透明的报价和退出机制。现在能确认的是,Google在买非公开代码访问权;还不能确认的是,这些代码会流向哪一个具体AI模型、覆盖多少开发者、每笔报价是多少。
