Simon Willison 在一篇 TIL 里记录了一个很具体的操作:Claude Fable 5 刚发布,AgentsView 使用的价格数据库还没有包含它,他就自己给这个模型补了价格。

这事有意思的地方不在“新模型又来了”。而在一个更日常的问题:当模型价格库慢半拍时,开发者还要不要等工具更新,才能知道今天的 AI 编程到底花了多少钱?

AgentsView 是 Wes McKinney 开发的 Python 工具。它分析的是本机 coding agent 的 transcript 和 token 使用,而不是云端平台的总账单。Willison 用 Claude Fable 5 反向理解 AgentsView,找到了自定义价格配置办法,再把当天多个本地项目的成本画了出来。

我更在意的是这层变化:AI 编程的成本管理,正在从“月底看一眼总额”,变成“现在就知道哪次会话把钱花掉了”。

价格库慢半拍,开发者不能跟着失明

Claude Fable 5 的触发点很典型:模型当天发布,AgentsView 的价格数据库还没覆盖。

这不是某个工具的失误。模型更新太快,价格、缓存、输入输出计费方式也会变。只靠内置价格库,最容易在新模型刚上手的几天看不清成本。

Willison 的办法是手动补价格。原文没有给出完整配置路径、命令或具体参数,所以不能把它写成一份可复制教程。能确认的是,AgentsView 支持通过自定义价格补齐估算口径。

这对两类人最直接。

个人开发者可以先小范围试新模型,不必等到账单出来才发现成本失控。小团队则可以把新模型接入节奏放慢一点:先补价格、看项目归因,再决定是不是迁移更多任务。

成本视角能回答的问题现实限制
云端账单账户一共花了多少钱很难定位到本地项目和具体会话
AgentsView哪个项目、哪个 agent、哪次会话消耗最多估算依赖 transcript、token 和价格口径
手动定价新模型未入库时先算起来价格填错会带来错误判断

所以它不是替代云端账单。它更像一本本地明细账。

账房先生不决定你该不该花钱,但能告诉你钱从哪儿漏出去。

Treemap 的重点不是 74 美元,而是谁花了钱

Willison 展示的 treemap 里,prod_datasette_agent 项目约 74.06 美元,占 89.3%。其他项目如 clouddatasettemoney 低很多。截图里还显示,缓存读取达到 57.6M,缓存节省约 516.62 美元。

这些数字很容易被看歪。

74.06 美元不是 Claude Fable 5 的普遍成本水平。516.62 美元也不是退款、返现或收入。它们只是 Willison 当天个人使用,在特定工具口径下算出的估算账本。

但这张图的价值也正在这里。它把一句模糊的“今天 agent 用得挺多”,拆成了更具体的判断:哪个项目吃掉了大头,哪次会话最贵,缓存到底帮没帮上忙。

对经常跑 coding agent 的人,这比总账单更有用。

一个开发者可能同时使用 Claude Code、Codex CLI、Aider 或其他本地 agent。任务散在多个 repo 里。月底平台账单涨了,只看总额很难判断原因:是模型更贵,还是上下文太长?是缓存命中好但任务本身巨大,还是某个 agent 在重复读文件?

AgentsView 给不了所有答案,但它给了取证入口。

接下来要看三件事

目前能确认的是,AgentsView 可以通过自定义价格绕过价格库滞后。还看不清的是,这套办法在团队场景里能不能稳定复用。

手动定价有弹性,也有风险。价格口径一旦错,图表越清楚,误导越强。对团队来说,这不是小问题。采购、报销、项目预算、模型切换,都会被这些数字影响。

接下来更该看三件事。

观察点为什么重要可能影响的动作
新模型价格更新速度决定估算能否及时跟上试用团队是否延后大规模迁移
缓存成本口径决定“节省”是否可解释开发者是否调整上下文和会话方式
项目与 agent 归因决定账能否分到责任对象团队是否按项目设置预算线

我不太买账的是,把这类工具只当成可视化面板。漂亮图表只是表层。真正有用的是,它让开发者能把 AI 编程从“凭感觉用”,推到“按任务算”。

这会改变一些很实际的选择。

新模型刚发布时,团队未必要立刻全面切过去。可以先在少数项目里跑,补上价格,观察高成本会话,再决定是否扩大使用。个人开发者也可以据此调整任务拆分:长上下文任务少开几轮,重复探索任务更重视缓存。

回到开头那个问题:价格库没跟上时,是不是只能等?

至少在 AgentsView 这个例子里,答案不是。你可以先把账算起来。但也要记住,算得快不等于算得准。价格、缓存和归因口径,才是这本账能不能用的根。