Anthropic 这次先把误会堵死了:Claude Science 不是新模型,也不是更强的生物模型。
它跑的还是现有 Claude,包括 Claude Opus 4.8。变化不在模型大脑,而在科研桌面。Anthropic 想把数据库、代码管线、分析工具、图表、引用和协作塞进一个工作台里。
这比发布一个“科学大模型”低调。但商业味更重。
Claude Science 到底是什么
Claude Science 的定位是面向计算科研的 AI workbench。
它要解决的不是“模型会不会聊天”,而是科学家每天在不同系统之间来回切的问题。数据库查一遍,工具跑一遍,代码改一遍,图表导一遍,引用再核一遍。真正耗时间的,经常就在这些缝里。
| 能力 | Claude Science 做什么 | 对科研团队的意义 |
|---|---|---|
| 数据入口 | 连接 60 多个科学数据库 | 少做重复检索和手工切换 |
| 工具链 | 支持基因组学、蛋白结构、化学等工具包 | 把模型接到科研软件和计算流程上 |
| 多智能体 | 主助手可生成子助手,也能调用用户自建专家助手 | 把复杂任务拆给不同助手处理 |
| 可复现 | 图表附带生成代码、环境、说明和完整消息历史 | 方便追溯结果从哪里来 |
| 核查 | 独立事实核查助手检查引用和计算 | 多一道检查,但不是最终裁判 |
最容易被夸大的就是核查。
这个事实核查助手不是外部真相源。它仍然基于同一底层模型体系。它能帮你发现一部分伪引用、错算和不一致,但不能替代实验验证、同行评议和审稿。
Anthropic 披露了几个早期案例。Gladstone Institutes 的 Sean Whalen 用它在几天内搭了一个基因组浏览器。Allen Institute 的 Jérôme Lecoq 用它构建多智能体计算综述流程,据称节省了大量人工时间。
这些案例有参考价值,也要当营销样本看。漂亮样板不是生产率革命。科研现场最难的,往往不是第一次跑通,而是第十次、第一百次还能不能复跑。
商业上,Claude Science beta 面向 Pro、Max、Team、Enterprise 用户开放。Anthropic 还提供最多 50 个科研项目支持,每个最高 3 万美元 credits,申请到 2026 年 7 月中旬结束。
这说明它想让研究团队先把流程跑起来。不是先卖神话,先占习惯。
三家公司押的不是同一条路线
把 Anthropic、OpenAI、DeepMind 放在一起看,差异很清楚。
| 公司 | 押注点 | 现实含义 |
|---|---|---|
| Anthropic | 工作流和操作层 | 不发新科学模型,先抢实验室入口 |
| OpenAI | 生物专用模型 | GPT-Rosalind 是受限研究预览,面向合格美国企业客户 |
| Google DeepMind | 基础科学模型和数据库资产 | AlphaFold、AlphaGenome 等资产更偏上游 |
OpenAI 的 GPT-Rosalind 走的是专用生物模型路线,访问更谨慎,面向通过资格和安全要求的美国企业客户。DeepMind 更像站在上游,手里有 AlphaFold、AlphaGenome 这类基础科学资产。
Anthropic 走了另一条路:不争“我有最强科学大脑”,而是争“你每天在哪个界面里工作”。
这很产品经理,也很现实。
早期办公软件、数据库、企业协作工具的战争里,很多赢家不是单点技术最漂亮的一方,而是变成了组织每天打开的入口。天下熙熙,皆为利来。放到科研 AI 里,这个“利”不只是模型能力,也是预算、权限、数据流、审计记录和团队习惯。
对药企和科研机构来说,采购判断会更麻烦。
如果只是买一个会回答问题的模型,评测相对简单。看准确率,看幻觉,看成本。但如果买的是工作台,就要看更多东西:数据能不能留在自己的基础设施里,权限怎么管,计算环境怎么复现,日志怎么审计,合规部门能不能签字。
目前公开信息还不足以回答所有部署和数据安全细节。技术团队最好别急着把核心研究流程迁进去。更合适的动作,是拿非关键项目试点:文献整理、公开数据库检索、代码草稿、图表复现、内部方法综述。
药企采购也不该只问“比 Claude 普通版强多少”。更该问:它接入现有 LIMS、ELN、数据湖和审计系统的成本有多高?迁移出去难不难?核查机制有没有外部证据链?
这才是钱会卡住的地方。
真门槛不是演示效果,是实验室日常
我更在意的是,Claude Science 把科学 AI 的竞争往下压了一层。
过去大家盯模型:谁更懂蛋白,谁更会推理,谁能写出更像论文的答案。现在问题变成:谁能接住数据、工具、代码、图表、引用、权限、审计和协作。
科研不是一段漂亮回答。科研是一条可复现的链。
Claude Science 做对的一点,是没有硬把自己包装成新科学大脑。它补的是工作流。这个方向不性感,但离真实使用更近。
风险也在这里。
今天它替实验室省掉切换成本。明天它可能增加迁移成本。工作流一旦被平台吃进去,团队习惯、数据接口、项目历史和审计记录都会沉进去。工具越顺手,换掉越痛。
最该观察的不是下一次模型分数涨多少,而是三件事:
- 科研团队会不会把它从辅助任务推进到核心计算流程;
- 机构合规和安全团队能不能接受它的权限、日志和数据边界;
- 事实核查能不能接入更可靠的外部证据,而不是只靠同一模型体系互相检查。
如果这三件事过不了,Claude Science 就是一个好用的科研助手集合。能省时间,但不会改写组织流程。
如果过了,它就不只是工具。它会变成科研 AI 的操作台。
模型看着更强,产品反而可能更虚。工作流看着朴素,却最容易变成入口。Anthropic 这次讲的是一个小故事:把 AI 放到科学家每天真正干活的地方。
小故事,才难缠。
