Google 又把 Gemini 往前推了一步。新上线的不是一个独立 App,而是 Chrome 里的 Gemini 侧边栏,新增 7 个国家:澳大利亚、印尼、日本、菲律宾、新加坡、韩国、越南。
这次更新真正补强的,不是“Google 继续扩张”这种废话,而是三件更具体的事:它已经能在 Chrome 里跨标签页问答、连 Gmail 和 Google Photos 给个性化回答、调 Calendar 和 Maps,甚至起草邮件、处理图片;除日本外,多数新增市场还覆盖桌面端和 iOS;更关键的是,真正更危险也更值钱的代理式控制能力,还只给美国 AI Pro 和 AI Ultra 付费用户试用。
旧稿我写的是,Google Photos 把修图做成默认语气,按钮更顺手,语言也更像机器。现在看,这条线索应该往前再推一步:不是 Photos 一处变了,是 Google 正把一整套产品都改成 Gemini 的语气,Chrome 则成了那个最肥的入口。
新增了什么:不是多了七国,而是能力边界更清楚了
先把这次更新讲短。
- 上线范围.澳大利亚、印尼、日本、菲律宾、新加坡、韩国、越南
- 上线节奏.1 月美国先发,3 月到印度、加拿大、新西兰,现在继续外扩
- 已公开能力.跨标签页总结和问答,连接 Gmail、Google Photos,调用 Calendar、Maps,起草邮件,处理图片
- 平台差异.除日本外,新增市场普遍覆盖桌面和 iOS
- 还没全面放开的能力.AI 直接替你操作浏览器、完成任务,仍限美国付费层测试
这几条很重要,因为它把一件事说得更明白了:Google 现在公开卖的是“会说话的侧边栏”,真正更能改写用户行为的,是“会动手的浏览器代理”,而那部分它收得很紧。
也就是说,这轮新闻不是技术奇观,而是分层投放。免费和广覆盖市场先吃到助手式能力,高价值、高权限、高风险的自动执行能力,先留在美国付费用户手里。刀先亮出来,刀柄还不肯放。
Chrome 不再只是看网页,它在接管你的碎片操作
这才是这条新闻最该看的地方。
很多人把 Gemini in Chrome 理解成“浏览器里多了个 AI 聊天框”。我不太认。这么看,太轻了。它已经开始碰用户最日常、也最黏的那层动作:查资料、对照标签页、看照片、翻邮箱、定会议、找地点、写邮件、改图片。
这些动作单看都不大,合起来就是工作流。浏览器一旦开始吞工作流,它就不再只是入口,而是调度台。
古话说“天下熙熙,皆为利来”。平台竞争里,入口永远比参数更值钱。模型可以追,界面可以抄,默认入口一旦拿稳,用户就会在无数次顺手点击里替平台把护城河再挖深一点。
Google 手里的牌,本来就不是单一模型强不强,而是 Chrome 的装机量、Google 账号体系、Gmail/Photos/Calendar/Maps 的连续性。现在 Gemini 把这几张牌串起来了。听上去像新智能,骨子里还是老平台术:先占默认位,再吃后续动作。
这和Google Photos那条线,是同一件事
旧稿盯的是 Google Photos:修图入口更顺手,提示语言更像机器替你发号施令。那时我更在意的是产品语气变了,AI 不再只是一个工具按钮,而是在引导你接受“默认增强”“默认建议”“默认生成”。
新线索把这个判断补完整了。Photos 不是孤例。Chrome、Gmail、Calendar、Maps、Photos,Google 正在把这些服务都接到 Gemini 这一层上。于是问题不只是“某个产品更 AI 了”,而是 Google 在把自己的服务网改写成一个统一的 AI 交互面。
这就是新版最该补上的地方:旧稿看见的是一个产品表情的变化,新信息说明,那其实是系统级动作的一角。
换句话说,Google Photos 把修图做成默认语气,Chrome 则在把这种默认语气扩成默认入口。一个改的是你点按钮的习惯,一个改的是你处理信息和任务的路径。
谁会先感到不舒服:不是轻度用户,是靠浏览器干活的人
受影响最早、最深的,不是偶尔搜点东西的人,而是长期挂着一堆标签页工作的人。
最典型的是两类:
- 内容、运营、市场、销售、研究这类信息密集型岗位
- 学生、老师、知识工作者这类高度依赖浏览器整合资料的人
对他们来说,Gemini in Chrome 的价值不在“会不会聊天”,而在能不能少切几个标签、少开几个网页、少做几次复制粘贴。只要它把这些碎片动作吃掉一部分,迁移成本就会上升。
到那时,你换掉的不是一个浏览器,而是一套已经被浏览器接管的日常动作。
这也是我对“助手更懂你了”这套说法最不买账的地方。方便当然是真的。可方便背后,是更深的账号绑定、更厚的服务捆绑、更多默认授权。浏览网页和留在 Google 体系里,边界会越来越糊。
历史上这种事演过很多次。IE 借 Windows 拿默认位,后来 Edge 继续借系统层推自家服务。历史不会照抄,但权力结构常常押同一道题:谁拿默认入口,谁就有资格把“便利”包装成“唯一顺手的路径”。
Google 这次还没走到最猛那一步。代理式浏览器控制能力还关在美国付费层里,这说明它自己也知道,真正会改写竞争格局的不是总结网页,而是替你点按钮、替你提交表单、替你完成任务。一旦这部分大规模放开,浏览器战争就不是“谁更懂网页”,而是“谁更懂怎么替用户行使操作权”。
接下来别盯国家数了,盯这三件事
新增多少国家,新闻价值有限。更该盯的是下面三件事。
- 代理式控制能力何时走出美国付费测试
- Personal Intelligence 还会接进多少 Google 服务
- 监管会不会重新审视浏览器作为 AI 分发入口的捆绑力量
我更在意第一条。因为侧边栏回答问题,还是助手逻辑;代你操作浏览器,已经是代理逻辑。两者不是同一个量级。
凯文·凯利那句老话,科技最终会变成基础设施。问题在于,基础设施一旦私有化,用户感受到的是顺手,平台拿到的是调度权。Chrome 现在越来越像这种东西:看着只是个浏览器,实则在往工作层、分发层、执行层伸手。
“挟天子以令诸侯”放到今天当然不必硬套,但借入口号令生态,味道是对的。浏览器还叫浏览器,角色已经不是原来的角色了。
