Claude Sonnet 5 上线：Anthropic 把更强智能体能力放进中档价格

核心摘要 Summary

Anthropic 发布 Claude Sonnet 5，并把它设为 Claude Free 和 Pro 的默认模型，同时开放 Claude Code 与 API。
它不是用来全面取代 Opus 4.8，而是用更低价格补上 Sonnet 与 Opus 之间的智能体能力空档。
开发者和企业团队该重点看三件事：长流程任务成功率、真实 token 成本、安全拦截边界。

Anthropic 这次把 Claude Sonnet 5 放到了一个很微妙的位置：Free 和 Pro 默认可用，Max、Team、Enterprise 也能用，Claude Code 和 Claude Platform/API 同步上线，API 模型名是 claude-sonnet-5。

更有意思的是定位。Anthropic 没有说 Sonnet 5 全面超过 Opus 4.8，而是说它性能接近 Opus 4.8、价格更低；高准确率任务上，Opus 4.8 仍是首选。

这就把问题说清了：Sonnet 5 不是来争旗舰王座的。它更像是把“能计划、会用工具、能跑长流程”的智能体能力，压到更常用的价格层。

Sonnet 5 补的是 Sonnet 与 Opus 之间的工作流空档

Sonnet 5 主打智能体能力。Anthropic 强调它能制定计划，调用浏览器、终端等工具，并完成更长流程的自主执行。

这类能力的价值，不在一次回答多漂亮，而在任务能不能从开头推到结尾。代码修复、资料检索、企业系统里的流程自动化，卡点往往不是“模型不会说”，而是“做到一半停住”。

和 Sonnet 4.6 相比，Anthropic 称 Sonnet 5 在推理、工具使用、编码和知识工作上都有提升。和 Opus 4.8 相比，它接近但没有超过。

对比对象	Anthropic 给出的变化	对使用者的含义
Sonnet 4.6	推理、工具使用、编码、知识工作提升	更适合多步骤任务，不只是问答和补全
Opus 4.8	性能接近，但未超越	预算敏感任务可先试 Sonnet 5，高准确率任务继续用 Opus
Claude Code	Sonnet 5 可用	编码代理可以用更低成本跑更多尝试
Claude Free / Pro	Sonnet 5 成为默认模型	普通开发者试用门槛下降
Max / Team / Enterprise	Sonnet 5 可用	团队可以做灰度迁移，而不是一次性替换旗舰模型

对 AI 应用开发者来说，比较现实的动作是：把非关键链路先切到 Sonnet 5。比如草稿生成、代码初修、资料整理、工单分流。核心链路、强约束输出、金融法务类高准确率任务，不急着从 Opus 4.8 上撤。

对企业自动化和编码工具决策者来说，动作更具体：先做 A/B。看同一批任务里，Sonnet 5 的完成率、人工接管次数、工具调用失败率和最终账单。别只看单次调用价格。

一句话，Sonnet 5 的关键不是“更聪明”四个字，而是能不能把更多生产任务从旗舰模型手里接下来。

价格更低，但真实成本要算 tokenizer

Sonnet 5 API 有介绍价。到 2026 年 8 月 31 日，输入 2 美元/百万 tokens，输出 10 美元/百万 tokens。之后价格为输入 3 美元/百万 tokens，输出 15 美元/百万 tokens。

这个价格让它看起来适合规模化调用。尤其是代码代理和企业自动化，调用次数多，模型单价会直接影响是否能大面积铺开。

但这里有一个容易被忽略的变量：tokenizer 变了。Anthropic 提到，同一段输入的 token 数可能增加约 1.0 到 1.35 倍，取决于内容类型。

成本项	当前信息	现实影响
API 介绍价	输入 2 美元、输出 10 美元/百万 tokens，截至 2026 年 8 月 31 日	适合迁移期测试和扩大调用量
介绍价之后	输入 3 美元、输出 15 美元/百万 tokens	长期成本要重新测算
tokenizer 变化	同一输入 token 数可能变为约 1.0–1.35 倍	单价下降不等于账单同比例下降
长流程任务	计划、工具调用、重试会增加消耗	要看完整任务成本，不只看单轮对话

这也是我更在意的地方。智能体模型的成本，不是“输入多少钱、输出多少钱”就能算完。它还包括工具调用、上下文长度、重试次数、失败后的人工接管。

所以更稳的迁移方式不是全量替换，而是分层使用：低风险、高频任务先迁；高风险、高准确率任务保留 Opus 4.8；中间层用 Sonnet 5 跑一段时间，看真实账单和成功率。

如果一个团队已经在用 Claude Code，Sonnet 5 值得尽快放进候选池。不是因为它一定更强，而是它可能让“多跑几次代理尝试”变得没那么贵。

安全边界有改善，但不能当成网络安全神器

Anthropic 称，Sonnet 5 的总体不良行为低于 Sonnet 4.6。在智能体场景下，它更会拒绝恶意请求，也更能抵抗提示注入攻击。幻觉和迎合倾向也有所下降。

这对企业很重要。智能体一旦接上浏览器、终端和内部系统，风险就从“说错话”变成“做错事”。能不能拒绝恶意指令，能不能识别提示注入，直接影响上线边界。

但限制也要摆出来。Anthropic 的安全评估显示，Sonnet 5 在部分错配行为上高于 Opus 4.8 和 Claude Mythos Preview。也就是说，它总体更稳，不代表每个风险维度都更低。

网络安全能力更不能夸大。Anthropic 表示没有专门训练 Sonnet 5 做网络安全任务。它能处理一些常规、无害的安全工作，但在 Firefox 漏洞 exploit 评估中，没有完成完整可用 exploit，只是部分成功率高于 Sonnet 4.6。

Sonnet 5 默认启用实时网络安全防护，强度与 Opus 4.7、4.8 类似，但低于更严格的 Fable 5。这说明 Anthropic 在给模型上保险，也说明它没有把 Sonnet 5 包装成攻防全能模型。

接下来最该看三件事。

观察点	为什么重要	适合谁看
长流程任务完成率	决定 Sonnet 5 能不能真接生产任务	AI 应用开发者、Claude Code 用户
迁移后的真实账单	tokenizer、重试和工具调用会改变成本	企业采购、平台团队
安全误拦与漏拦	影响合法安全研究和企业运维体验	安全团队、自动化平台负责人

如果 Sonnet 5 能把任务完成率拉上去，同时把账单压住，它就补上了 Sonnet 和 Opus 之间最实用的一格。若只是单轮表现好，长流程里频繁停住，那它仍只是一个更便宜的强模型，不是可靠的工作流底座。

回到开头那个微妙定位：Sonnet 5 不需要赢过 Opus 4.8 才有价值。它只要在成本、能力和安全边界之间站稳，就足够改变很多团队的模型选择。

Claude Sonnet 5 上线：Anthropic 把更强智能体能力放进中档价格

Sonnet 5

产品定位

默认开放

旗舰保留

能力主线

智能体增强

优先迁移

成本变量

介绍价

tokenizer

安全边界

拦截改善

风险残留

后续变量

Sonnet 5 补的是 Sonnet 与 Opus 之间的工作流空档

价格更低，但真实成本要算 tokenizer

安全边界有改善，但不能当成网络安全神器