一台放在厨房台面的 Google Home,被主人拔掉了插头。
导火索很小:她问演员 Geena Davis 多少岁,设备却回答“不提供这类事实”。
据 The Art of Doing Stuff 作者 Karen 6 月 12 日发布的文章,她过去用 Google Home 做的事很简单:做饭时问单位换算,听歌时识曲,看棒球比分,查演员年龄。现在,接入 Gemini 后,这些短问题变得啰嗦、回避,甚至不稳定。
这只是一个用户的体验,不能直接说成 Google Home 或 Gemini 的普遍故障。原文也没有给出具体设备型号、版本信息,或 Google 官方回应。
但这个例子很有代表性。它指向一个更大的产品问题:语音助手被 AI 化之后,是不是牺牲了原本最值钱的能力——快速给出简单答案。
简单问题,不该变成一段解释
Karen 对 Google Home 的不满,集中在几个生活场景里。
这些问题都不复杂。它们也不是“智能体任务”。用户不需要模型展开推理,不需要讲背景,更不需要把一次厨房查询变成一次对话。
| 使用场景 | 过去的期待 | Gemini 后的吐槽 | 直接影响 |
|---|---|---|---|
| 烹饪换算 | 半杯等于几汤匙,直接给数字 | 回答变长,不能只给“8” | 做饭时被打断 |
| 识别歌曲 | 听到歌,快速识曲 | 作者称功能消失 | 家庭高频小工具失效 |
| 体育比分 | 给当前比分 | 曾给出数局前比分 | 即时信息可信度下降 |
| 医疗相关问题 | 简短回答常识问题 | 先给免责声明 | 用户要多听一段话 |
| 人物年龄 | 直接回答事实 | Geena Davis 年龄未答 | 简单事实也有摩擦 |
这里最刺人的,不是 Gemini 不会聊天。恰恰相反,它更像是“太会说”。
问脱水是否会导致头痛,它先声明自己不是医疗专业人士。这个处理可以理解,医疗问题确实有风险。但用户在厨房里问一个常识问题时,最想要的是边界清楚的短答,而不是一段仪式化的自我保护。
问半杯是多少汤匙,答案就是 8。多出来的解释,在网页搜索里可能还算完整,在语音场景里就是噪音。
语音助手的第一价值,是免手操作。手上有面粉、锅在火上、电视还开着,用户不想盯屏幕,也不想听长段落。
所以问题不在于 AI 有没有变强。问题在于,它有没有把“短、准、稳”这件小事弄丢。
这不是 Alexa 赢了,而是旧工具被新能力挤掉了
Karen 后来买了 Alexa。但这不等于她认可 Amazon,也不等于 Alexa 全面胜出。
更准确地说,这是一次反弹式替代。一个原本顺手的工具失灵了,用户就换一个还能完成基础任务的设备。
这点很重要。因为如果把这件事写成“Google 输给 Amazon”,反而会看偏。
真正的对比不是 Google 和 Amazon,而是两种产品逻辑:
| 对比对象 | 核心目标 | 用户感受 |
|---|---|---|
| 有用的旧语音助手 | 听懂短命令,给短答案 | 像开关,省事 |
| 更 AI 化的新助手 | 更会解释,更会规避,更会对话 | 像客服,打断流程 |
Google 在 2024 年将 Bard 更名为 Gemini,并持续把生成式 AI 能力放进搜索、Android 和助手类产品。这条路线不奇怪。科技公司需要证明助手不只是报天气、设闹钟、查单位。
可家用智能音箱不是演示台。
它被放在厨房、客厅、卧室。它被使用的时间,往往是用户没空操作手机的时候。这个场景天然反对长回答。
很多 AI 产品升级,都容易掉进“过度改进”的坑。原来用户买它,是因为它像工具。升级之后,它变得像一个随时准备展开讨论的人。
工具一旦开始打扰人,就很难再被信任。
这里也有现实约束。生成式 AI 要处理风险问题,要避免给出不可靠答案,也要适配更多复杂请求。厂商不可能把所有回答都压成一个词。
但语音助手至少应该区分场景。查人物年龄、单位换算、当前比分,这类事实型短任务,本来就应该优先短答。需要补充时,再让用户追问。
少说,不是能力弱。很多时候是产品判断更强。
受影响的人,该先看自己的高频问题
这件事对智能音箱用户的提醒很直接:不要只看宣传里的“更智能”。要看它还能不能稳定回答你每天最常问的十个问题。
如果你主要用音箱做饭、开灯、设定时器、查天气、听歌识曲,那就先观望。换设备前,最好测试几个高频问题:单位换算是否直答,比分是否及时,识曲是否还在,人物年龄这类普通事实是否会回避。
如果你正在给家里老人、孩子或厨房场景采购智能音箱,动作可以更保守一点。先别急着因为 AI 升级就换新。短任务稳定性,比“能不能聊天”更重要。
对关注 AI 产品体验的人,这个案例也值得记下来。它说明模型能力提升和产品可用性提升,不是同一件事。
目前还看不清的,是 Google 会不会在家庭设备上提供更明确的选择。比如“简短回答”“直接事实”“少解释模式”。原文没有提供相关设置验证,也没有 Google 回应,所以不能下定论。
但观察点很清楚:
- 简单事实是否能直答;
- 语音回答是否明显变长;
- 旧功能是否被保留,比如识曲;
- 用户能否切换回答风格,而不是被迫接受同一种 AI 人格。
这才是 AI 助手进入家庭后的硬指标。
厨房里的问题本来很朴素:半杯是多少汤匙,比分现在多少,Geena Davis 多少岁。用户问这些,不是想测试大模型边界,而是想把手头的事做完。
如果一次升级让设备更能说,却更难用,那它就不是进步,只是把炫技摆在了用处前面。
器以致用。音箱放在厨房里,先得像个好工具,再谈像不像聪明人。
