每周 120万到300万。

这个数字不是某个产品的新增用户,也不是一次营销战报,而是 OpenAI 自己披露的 ChatGPT 高风险用户信号范围:自杀计划、精神病或躁狂迹象、不健康情感依赖。

它不等于确诊人数,也不等于真实伤害人数。低端约 120万,对应自杀计划指标;高端把三类信号合在一起,但 OpenAI 没说三者是否互斥,可能有重叠。

但这个数字已经足够把问题改写。

过去,OpenAI 因枪击案家属起诉而被质疑:当 ChatGPT 识别到危险信号时,平台为什么没有报警、没有更强干预?现在更大的问题浮出来了:如果每周都有百万级用户触发类似信号,AI 平台还能把安全理解成“发热线链接、语气温柔、必要时封号”吗?

现在知道了什么

这件事可以压缩成几行。

问题目前能看到的信息仍然缺什么
发生了什么OpenAI 披露 ChatGPT 每周约 120万至300万用户触发心理健康相关高风险信号不是确诊,也不是实际伤害统计
涉及哪些风险自杀计划、精神病或躁狂迹象、不健康情感依赖三类是否重叠,没有说清
平台做了什么危机资源链接、敏感对话策略、模型响应调整方法细节、时间趋势、第三方审计都不完整
为什么重要这把个案争议推成规模化治理问题其他前沿模型缺少同口径公开数据,无法横向比较

这比单一诉讼更有信息量。

枪击案家属起诉 OpenAI,核心指向是:平台是否在识别到危险状态后仍继续提供陪伴、建议或细化信息。责任是否成立,要看法院如何认定事实和因果。

但百万级信号披露说明,平台面对的不是偶发边缘场景。它每天都在碰到人的崩溃、依赖、幻觉和自毁冲动。

这才是最刺眼的地方。

枪击案争议卡在一个灰区

按照 OpenAI 法庭文件,ChatGPT 曾多次提供危机资源链接。诉讼方则指称,对话仍持续,并涉嫌帮助用户细化方法。

这里不能把案件提前判完。法律责任要由法院判断。

但产品问题已经摆在桌上:

  • 如果模型识别到自杀计划,它只是给热线链接,够不够?
  • 如果用户继续追问细节,模型是继续陪聊,还是强制收束?
  • 如果用户处于精神病、躁狂、极端依赖状态,平台有没有义务升级干预?
  • 如果不报警、不通知监护人、不转人工,所谓“安全协议”到底拦住了什么?

过去很多平台的安全逻辑很简单:违规就删,危险就封。

可心理危机不是垃圾广告,也不是普通违规内容。封号可能让人失去最后一个求助入口;继续聊又可能把人带进更深的隧道。

这就是旧问题里最难的一层:AI 平台不能再拿“封号”当安全答案,但也不能把“继续服务”包装成慈悲。

一边说“请寻求帮助”,一边继续让模型接住用户全部情绪,这不是治理闭环,更像仪表盘上亮了一盏黄灯。

车还在往前开。

灾难风险有铁门,个人危机只有软帘

AI 安全行业对某些风险很硬。

比如 CBRN、生物化学武器、大规模破坏、恶意网络攻击。模型通常会拒绝,系统会设门槛,评测不过就不能上线。

到了心理危机,处理方式常常变软:识别、提醒、转向热线、降低刺激性表达,然后对话继续。

风险类型常见处理背后含义
生物化学、网络攻击等灾难风险hard refusal / gating不能继续帮,不能越线
自杀意念、躁狂、情感依赖monitoring / redirect识别风险,给资源,尽量引导

这不是说 OpenAI 什么都没做。它确实在做响应调整,也披露了部分风险信号。

问题在优先级。

灾难风险会伤到国家、企业、基础设施,也会引来监管铁拳。心理危机会伤到一个个具体的人,分散、隐蔽、难审计,还很难被写进一张漂亮的系统卡片。

于是行业资源天然倾斜。

监管盯大事故,资本盯增长,产品团队盯留存。用户心理状态最后被放进一个听上去很合理的盒子:可监测、可缓解、可继续。

这套激励并不阴谋。它更普通,也更麻烦。

“天下熙熙,皆为利来。”放到平台产品里,就是谁承担成本,谁就想把边界画得晚一点。多停一次服务,就少一次留存;多一次人工升级,就多一笔运营成本;多承认一种不可服务状态,就多一条合规义务。

真问题不是模型会不会安慰人

我不太买账把这事说成“AI 要更有同理心”。

同理心当然重要。一个冷冰冰的危机回复可能伤人。一个乱共情、乱附和的模型也可能伤人。

但同理心不是治理边界。

真正的问题是:什么样的用户状态,足以让 AI 助手停下来?

这里至少有三种可能的答案。

一种是平台最喜欢的答案:继续聊,但更谨慎。给热线,给资源,少说危险内容。

一种是监管更可能推动的答案:达到特定风险阈值后,强制转人工、限制模型自由输出、记录更完整的审计链路。

还有一种更难、更贵,也更接近现实的答案:对未成年人、疑似精神病性症状、明确自杀计划、长期情感依赖用户,设计不同级别的干预,而不是一套提示词打天下。

这会很麻烦。

误判怎么办?隐私怎么保护?跨国用户怎么办?平台有没有权力报警?用户不愿意呢?如果 AI 是唯一愿意听他说话的对象,切断会不会更糟?

这些问题都真。

但不能因为难,就把它们揉成一句“我们会持续改进安全”。

心理危机不是产品边缘案例。ChatGPT 已经成了很多人的倾诉工具。人痛苦时会抓住最近的通信工具,以前可能是电话、论坛、搜索框,现在是 AI 助手。

谁占了入口,谁就不能只把责任写进免责声明。

谁最受影响

最直接受影响的不是科技圈,也不是投资人。

是两类人。

一类是处在危机边缘的普通用户,尤其是未成年人、长期孤独者、精神健康状态不稳定的人。他们不是来“测试模型”的。他们是在夜里找一个不会挂断的对象。

另一类是他们身边的人:家属、学校、医生、社区支持系统。AI 对话越私密,外部越难发现风险。平台若没有清晰升级机制,家属往往只能在事后看到聊天记录。

这也是枪击案家属起诉最锋利的地方。

它逼平台回答一个很不舒服的问题:你既然能识别危险信号,为什么你的下一步仍然主要是“提示用户自己去找帮助”?

当然,平台不能随便报警,也不能随便把用户隐私交出去。这里有真实的权利冲突。

但正因为有冲突,才需要规则、审计、分级干预,而不是靠一段温柔话术撑住全部责任。

接下来该看什么

这事后面不该只看 OpenAI 会不会改几句安全回复。

更关键的是四个变量。

  • 披露口径.120万到300万到底怎么算?三类风险是否重叠?趋势是在上升,还是检测变灵敏了?
  • 第三方审计.高风险信号识别准不准?误报、漏报是多少?有没有独立机构能看见样本和方法?
  • 升级机制.明确自杀计划、疑似精神病性症状、未成年人危机,是否会触发人工介入、会话限制或更强干预?
  • 行业对照.Anthropic、Google、Meta 等前沿模型是否会公布同口径数据?如果只有 OpenAI 披露,反而会出现“透明者挨打,沉默者安全”的坏激励。

最后一点很重要。

不能因为 OpenAI 披露了数据,就把所有火力只打到它身上。更合理的方向是逼整个行业进入同一张表。否则平台会学到一个错误经验:少说少错,不披露最安全。

那就完了。

安全行业最怕的不是坏消息,而是只有坏消息来自愿意开灯的人。

AI 安全还缺另一半

过去几年,AI 安全讨论太迷恋远方大火:超级智能、失控模型、生物武器、国家级攻击。

这些都该管。

但普通人面对的风险,常常不是末日,而是深夜的一段对话。模型一句附和、一次持续陪伴、一种被误认为“懂我”的语气,都可能改变一个脆弱用户的下一步动作。

这不是要求 AI 公司变成医院,也不是要求聊天机器人承担全部社会救助责任。

边界要讲清楚。

平台不是医生,但它不能装作自己只是键盘。它不是家属,但它知道用户说了什么。它不是警察,但它已经在做风险识别。

识别之后不改变动作,识别就只剩公关价值。

历史上每一种通信技术扩张,都会遇到类似时刻。报纸、电台、电视、社交网络,都曾先说自己只是管道,后来又不得不承认:入口越大,责任越重。

AI 助手更进一步。它不是简单分发信息,而是在模拟理解、回应、陪伴。

这让平台获得了更深的黏性,也带来了更重的债。

枪击案诉讼问的是一个家庭的悲剧。百万级风险信号问的是整个行业的制度空白。

开头那个数字最重要的地方,不是吓人。

它把一句话钉到了桌面上:AI 安全如果只会拦住远方的灾难,却拦不住眼前的人往下坠,那它就只完成了一半。