Simon Willison 在一篇 TIL 里记录了一个很具体的操作:Claude Fable 5 刚发布,AgentsView 使用的价格数据库还没有包含它,他就自己给这个模型补了价格。
这事有意思的地方不在“新模型又来了”。而在一个更日常的问题:当模型价格库慢半拍时,开发者还要不要等工具更新,才能知道今天的 AI 编程到底花了多少钱?
AgentsView 是 Wes McKinney 开发的 Python 工具。它分析的是本机 coding agent 的 transcript 和 token 使用,而不是云端平台的总账单。Willison 用 Claude Fable 5 反向理解 AgentsView,找到了自定义价格配置办法,再把当天多个本地项目的成本画了出来。
我更在意的是这层变化:AI 编程的成本管理,正在从“月底看一眼总额”,变成“现在就知道哪次会话把钱花掉了”。
价格库慢半拍,开发者不能跟着失明
Claude Fable 5 的触发点很典型:模型当天发布,AgentsView 的价格数据库还没覆盖。
这不是某个工具的失误。模型更新太快,价格、缓存、输入输出计费方式也会变。只靠内置价格库,最容易在新模型刚上手的几天看不清成本。
Willison 的办法是手动补价格。原文没有给出完整配置路径、命令或具体参数,所以不能把它写成一份可复制教程。能确认的是,AgentsView 支持通过自定义价格补齐估算口径。
这对两类人最直接。
个人开发者可以先小范围试新模型,不必等到账单出来才发现成本失控。小团队则可以把新模型接入节奏放慢一点:先补价格、看项目归因,再决定是不是迁移更多任务。
| 成本视角 | 能回答的问题 | 现实限制 |
|---|---|---|
| 云端账单 | 账户一共花了多少钱 | 很难定位到本地项目和具体会话 |
| AgentsView | 哪个项目、哪个 agent、哪次会话消耗最多 | 估算依赖 transcript、token 和价格口径 |
| 手动定价 | 新模型未入库时先算起来 | 价格填错会带来错误判断 |
所以它不是替代云端账单。它更像一本本地明细账。
账房先生不决定你该不该花钱,但能告诉你钱从哪儿漏出去。
Treemap 的重点不是 74 美元,而是谁花了钱
Willison 展示的 treemap 里,prod_datasette_agent 项目约 74.06 美元,占 89.3%。其他项目如 cloud、datasette、money 低很多。截图里还显示,缓存读取达到 57.6M,缓存节省约 516.62 美元。
这些数字很容易被看歪。
74.06 美元不是 Claude Fable 5 的普遍成本水平。516.62 美元也不是退款、返现或收入。它们只是 Willison 当天个人使用,在特定工具口径下算出的估算账本。
但这张图的价值也正在这里。它把一句模糊的“今天 agent 用得挺多”,拆成了更具体的判断:哪个项目吃掉了大头,哪次会话最贵,缓存到底帮没帮上忙。
对经常跑 coding agent 的人,这比总账单更有用。
一个开发者可能同时使用 Claude Code、Codex CLI、Aider 或其他本地 agent。任务散在多个 repo 里。月底平台账单涨了,只看总额很难判断原因:是模型更贵,还是上下文太长?是缓存命中好但任务本身巨大,还是某个 agent 在重复读文件?
AgentsView 给不了所有答案,但它给了取证入口。
接下来要看三件事
目前能确认的是,AgentsView 可以通过自定义价格绕过价格库滞后。还看不清的是,这套办法在团队场景里能不能稳定复用。
手动定价有弹性,也有风险。价格口径一旦错,图表越清楚,误导越强。对团队来说,这不是小问题。采购、报销、项目预算、模型切换,都会被这些数字影响。
接下来更该看三件事。
| 观察点 | 为什么重要 | 可能影响的动作 |
|---|---|---|
| 新模型价格更新速度 | 决定估算能否及时跟上试用 | 团队是否延后大规模迁移 |
| 缓存成本口径 | 决定“节省”是否可解释 | 开发者是否调整上下文和会话方式 |
| 项目与 agent 归因 | 决定账能否分到责任对象 | 团队是否按项目设置预算线 |
我不太买账的是,把这类工具只当成可视化面板。漂亮图表只是表层。真正有用的是,它让开发者能把 AI 编程从“凭感觉用”,推到“按任务算”。
这会改变一些很实际的选择。
新模型刚发布时,团队未必要立刻全面切过去。可以先在少数项目里跑,补上价格,观察高成本会话,再决定是否扩大使用。个人开发者也可以据此调整任务拆分:长上下文任务少开几轮,重复探索任务更重视缓存。
回到开头那个问题:价格库没跟上时,是不是只能等?
至少在 AgentsView 这个例子里,答案不是。你可以先把账算起来。但也要记住,算得快不等于算得准。价格、缓存和归因口径,才是这本账能不能用的根。
