Meta 和 AWS 签下新协议。Meta 将使用数百万颗 Amazon 自研 Graviton 芯片,支撑 AI agent 工作负载。
Graviton 是 ARM-based CPU,不是 GPU,也不是 Amazon 的 Trainium。把这条新闻读成“Amazon 芯片正面击败 Nvidia”,太急了。更准确的说法是:训练仍然重度依赖 GPU,但 AI agent 带来的推理、调度、代码执行、搜索调用和多步协调,正在把算力账本拆开。
Meta 买的是 Graviton CPU,不是训练用 GPU
Graviton 做的是通用计算。它适合服务编排、调度、后端任务,以及 agent 工作流里大量碎片化计算。GPU 仍是大模型训练的主力,尤其是大规模并行计算。
这次协议没有披露金额。能确定的是数量级很大,方向很清楚:Meta 要把一部分 AI agent 相关负载放到 AWS 的 CPU 体系里跑。
| 对象 | 这次涉及什么 | 不能误读成什么 | 真正影响 |
|---|---|---|---|
| AWS Graviton | ARM-based CPU | 替代 GPU 训练大模型 | 承接 agent 相关通用计算和推理侧配套任务 |
| AWS Trainium | Amazon 自研 AI 芯片 | 本次 Meta 协议主角 | 更偏训练和推理加速,是 AWS 另一条芯片线 |
| Nvidia GPU/系统 | 企业和云厂商都可采购 | 已被 AWS 压倒 | 仍是训练核心,但云厂商在改采购结构 |
| Google TPU | Google 自研 AI 加速器 | 与 Graviton 同类 CPU | 代表云厂商用自研芯片争 AI 工作负载 |
Meta 也没有放弃其他云。它此前主要使用 AWS,也使用 Azure;还与 Google Cloud 签过 6 年、100 亿美元云协议。大客户的逻辑很现实:哪朵云能给产能、价格、稳定性和迁移余地,负载就往哪里切一块。
对关注 AI 基础设施的人,这条新闻的价值不在“Meta 又买了什么”。价值在拆账:训练、推理、agent 编排、通用后端任务,开始分给不同芯片和不同云。以后看 AI 成本,不能只盯 GPU 单价。
AI agent 改写的是成本结构
过去两年,AI 行业最热的词是 H100、B200、训练集群。那是模型军备竞赛的上半场。agent 普及后,成本不只来自一次模型调用。
一个复杂请求背后,可能有规划、检索、代码执行、工具调用、状态管理、多轮校验。很多任务不是典型 GPU 负载。真正烧钱的地方,可能是海量小任务排队、重试、等待和跨服务调用。
企业客户最后看的也很冷:每一百万次请求多少钱,延迟多少,故障谁兜底,迁移要不要重写架构。
这正是 AWS 想切进去的位置。Andy Jassy 近期在股东信中点名 Nvidia 和 Intel,强调企业需要更好的 AI 性价比。话说得像成本优化,背后是云厂商的老生意:不只卖算力,还要卖账单、工具链和默认入口。
“天下熙熙,皆为利来。”放到 AI 云市场,就是客户追着成本走,云厂商追着黏性走。技术路线摆在台面上,计费权藏在后面。
对从业者更直接的动作是:采购团队会延后单一 GPU 方案的拍板,改看混合算力组合;平台团队要更早做可迁移设计,避免 agent 编排、日志、向量检索、权限系统全被某一家云绑死。便宜算力不是白送的,几年后的迁移成本会来收账。
AWS 借芯片锁云,Meta 借多云压价
AWS 宣布 Meta 协议的时间点很紧。Google Cloud Next 刚结束,Google 也刚发布新 TPU。两家云厂商都在向市场说明一件事:AI 工作负载不能只由 Nvidia 定价,也不能只按 GPU 供应来排队。
Amazon 还有 Anthropic 这张牌。Anthropic 已承诺 10 年在 AWS 花费 1000 亿美元,重点使用 Trainium。Amazon 对 Anthropic 的总投资已达 130 亿美元。
Graviton 吃 agent 周边的通用计算,Trainium吃更重的训练和推理任务。合在一起,AWS 要讲的不是“我也有芯片”,而是“你从模型到应用都可以留在我的云里”。
限制也很硬。AWS 自研芯片只通过云服务开放,客户拿到的是访问权,不是芯片本身。Nvidia 则向企业和云厂商销售芯片和系统,AWS 也仍可能是它的客户。这是两种商业模式:一个卖开放硬件供应,一个卖封闭算力池。
Nvidia、Google、Intel 面临的压力也不同。Nvidia 暂时不缺需求,但它要面对云厂商把更多工作负载拆走。Google 有 TPU和云入口,但要证明客户愿意把生产负载长期放进去。Intel 的问题更硬:在 AI 采购叙事里,它需要重新证明自己不是旁观者。
接下来最该看三件事。第一,Graviton 跑 agent 负载的真实性价比,而不是发布会说法。第二,Meta 是否把更多 AI 服务切到 AWS。第三,企业客户会不会把预算从“买 GPU”改成“买一整套云上 AI 成本结构”。
历史上,铁路公司争的从来不只是铁轨,电力公司争的也不只是发电机。谁控制网络、计费和接入,谁就控制下一轮利润分配。AI 芯片战现在也走到这一步,只是铁轨换成云,电表换成 token 和请求数。
