Mozilla 这次给出的数字很大:Anthropic 的 Mythos Preview 在 Firefox 150 发布前,从未发布源码里找出 271 个零日漏洞。Mozilla CTO Bobby Holley 的话更猛,称它“every bit as capable”,可比肩世界顶级安全研究员。
先别被气势带跑。这里的“零日”,指的是发布前未公开修复的漏洞,不等于都已在野利用,也不等于都属于高危远程利用。Mozilla 还没公开这 271 个漏洞的严重性分布。但即便把宣传口径先打个折,这个结果仍然说明一件事:找漏洞这件事,机器正在把成本往下砸。
271 个意味着什么
最有用的看法,不是盯着“271”本身,而是看对比。
| 项目 | 这次 | 对照 | 能说明什么 |
|---|---|---|---|
| 分析对象 | Firefox 150 未发布源码 | Firefox 148 | 都是浏览器核心代码,不是演示样本 |
| 模型 | Mythos Preview | Opus 4.6 | 不是小修小补,能力差距已经拉开 |
| 发现结果 | 271 个零日漏洞 | 22 个安全敏感 bug | 量级差距很大,不能只当营销修辞 |
| 传统手段 | AI 直接扫源码找问题 | 人工审计、fuzzing 仍在用 | AI 开始吃掉最贵、最慢的一段工作 |
这不代表人工审计和 fuzzing 失效。边界还是在。
人工研究员擅长深挖、验证、利用链分析。fuzzing 擅长用大量输入去撞出崩溃和异常。AI 更像在源码层面做高密度筛查,先把可疑点大批量拎出来。后面仍要人来确认、分级、修复、回归测试。
所以,现阶段更准确的说法是:AI 不是取代整条安全流程,而是在漏洞发现这一步,把原本昂贵的专家时间变成更便宜的机器时间。
真正变化是攻防成本,不是一句“防守方稳赢”
Holley 说防守方“终于有机会 decisively win”。我不太愿意跟着喊。安全不是找到洞就结束。发现之后,还有验证、补丁、兼容性测试、发布节奏、用户升级率。链条很长,短一环都不行。
但这条新闻依然重要。因为旧平衡本来就建在“发现很贵”上。顶级研究员稀缺,审计周期长,很多开源项目根本请不起。如今如果模型能把大量源码筛查前置,防守方至少拿到一件新武器。古人说“工欲善其事,必先利其器”,今天这把器,开始像样了。
问题也在这里。Mythos 目前仍是受限开放,只给关键合作方。也就是说,先拿到“机器安全研究员”的,不是所有防守者,而是少数资源更厚的大组织。
这就把新闻拆成了两层:
- 第一层,是技术层.AI 找漏洞,已经不是概念演示。
- 第二层,是分配层.谁拿得到这种能力,谁就能更早压低审计成本。
如果只看第一层,会觉得这是防守大捷。把第二层加进来,味道就变了:这更像安全能力的再集中。
历史上很多基础设施都这样。铁路、电力、云计算都降低了总成本,也抬高了组织门槛。今天的 AI 安全不完全一样,但结构相似:能力先集中,收益先集中,风险却不会只落在少数人头上。
谁先受益,谁会先被门槛甩开
最先吃到红利的,是浏览器厂商和大型软件供应商。它们代码多,攻击面大,也有安全团队、CI 流程和发布机制,能把模型给出的线索接住。对这类团队来说,接下来最现实的动作不是“要不要上 AI”,而是“要不要把源码审计流程改掉一部分”。采购、评估和内部试点会更快。
对开源维护者,这事既像救命绳,也像新门槛。
开源项目最适合被模型扫,因为源码公开、依赖广、影响大。要是这类模型能更普遍地给到基金会、核心组件维护者,很多过去排不上队的审计工作,可能终于做得起。
可要是同等级工具只停留在 Mozilla、Google、Anthropic 这类机构之间,结果就会反过来。大项目能先做“AI 安检”,小团队还得靠 issue、fuzzing 和偶然撞出来的报告。那时被放大的不只是代码差距,还有治理差距。
对普通 Firefox 用户,今天不用把自己吓到。已知信息更接近“发布前多找出了一批待修问题”,不是“你已经暴露在 271 个已被攻击的高危漏洞里”。更现实的动作只有一个:保持浏览器及时更新。因为这类能力的价值,最终还是要靠补丁落地。
对关注 AI 安全和软件供应链的从业者,这条消息的含义更直接:
- 如果你在做基础软件、安全工具或代码托管平台,接下来该评估的是,源码级 AI 审计会不会进入默认流程。
- 如果你在开源治理或基金会体系里,接下来该争的是工具可得性,而不是只围着模型演示鼓掌。
真正该盯的,也就三件事:
| 观察点 | 现在已知 | 还没答案 | 为什么重要 |
|---|---|---|---|
| 漏洞质量 | 有 271 个零日漏洞 | 严重级别分布未披露 | 决定这是不是“量大但含金量参差” |
| 能力开放 | Mythos 为受限开放 | 会不会走出关键合作方圈子 | 决定红利是扩散还是集中 |
| 行业跟进 | Mozilla 已给出案例 | 其他浏览器和基础组件团队会不会接入 | 决定这是一家样板,还是流程变化 |
如果后面公开的信息显示,这 271 个里大多只是低严重性问题,那结论要收一收。如果其他厂商很快也能复现接近的结果,那这件事就不只是 Mozilla 的漂亮案例,而是安全生产方式真的开始变了。
