404 Media 这次说得很具体:他们拿到了 Haotian AI,一款中文界面的实时视频深度伪造软件。它不是做一张假照片,也不是生成一段录好的视频,而是可以把使用者在 Microsoft Teams、WhatsApp、Zoom 这类通话里实时替换成别人。

这才是刺人的地方。

深伪本身早就不新鲜。真正的新变量,是它开始贴近诈骗最需要的那段链路:开会、确认身份、远程审批、催付款、改账户、过面试。以前“见个视频”还能给人一点安全感,现在这层安全感也开始漏风。

404 Media 早前关于 Haotian AI 的调查,重点更像是记者如何进入这类灰色工具圈、如何跨过那笔“入场费”。播客提供的补强,是把工具放进真实通信场景:Teams、WhatsApp、Zoom。它让问题从“有人在卖深伪软件”变成“深伪软件已经瞄准了远程信任的接口”。

目前能确定什么,不能确定什么

从 404 Media 播客摘要看,核心事实有三条:

  • 软件名.Haotian AI。
  • 界面语言.中文。
  • 能力.实时视频深度伪造,可用于 Microsoft Teams、WhatsApp、Zoom 等视频通话。

404 Media 还把它放在全球诈骗活动的语境下讨论,称其是诈骗工具链的一部分。

但边界也要说清。

目前公开摘要没有给出具体受害人数、诈骗金额、受害者名单,也没有披露开发者、售价、用户规模、模型架构、算力需求、绕过平台检测的方式。也就是说,现在还不能把 Haotian AI 写成一桩已经坐实的大规模犯罪案。

更准确的说法是:它至少表明,实时换脸正在从“炫技工具”靠近“诈骗基础设施”。

这比单纯多一个软件名重要。

风险不在假脸,在它进了通话链路

过去很多深伪风险停在“内容伪造”:假照片、假视频、假社交账号。麻烦归麻烦,但互动性有限。

实时视频换脸不同。它攻击的是会议软件长期建立的默认信任:对方出现在屏幕里,能点头,能说话,能接话,于是就被当成本人。

一个简单对照更清楚:

场景过去的风险Haotian AI 代表的变化影响
图片换脸伪造头像、包装账号进入实时视频流欺骗从“看图”变成“交谈”
录制视频可传播,难互动可接入会议软件更适合审批、面试、远程沟通
视频核验看脸、听声、问问题脸和声音都可能被合成或转接视频从强凭据降为弱信号

语音克隆诈骗还有一个缓冲:你可以挂掉电话,回拨号码,找第二个渠道确认。实时视频更难处理,因为它借用了视频会议本身的权威感。

屏幕里的那张脸,曾经是远程时代的门面。现在门面也会易容。

最先被迫改流程的不是普通用户

普通用户当然会担心亲友诈骗,但最先痛的,很可能不是普通人,而是企业里的三类岗位:财务审批、安全团队、远程身份核验服务商。

跨国公司、外包团队、远程招聘、线上开户,都靠视频降低身份不确定性。可一旦“视频可见”不再可靠,流程就会变贵、变慢、变烦。

企业不太可能禁止视频会议。那不现实。

它们更可能做几件事:

  • 高风险转账必须双人审批,不能只凭一次视频确认。
  • 陌生会议链接不能作为身份依据。
  • 账号重置、付款、合同签署,要回到企业通讯录、硬件密钥、已登记设备、线下回拨。
  • 视频只做辅助证据,不再做最终证明。

这才是现实代价。

AI 工具每降低一次作恶门槛,企业流程就要多加一道闸。省下来的成本在攻击者那边,增加的成本在防守者这边。天下熙熙,皆为利来。诈骗团伙要的是转化率,企业安全要付的是摩擦费。

这笔账不会消失,只会换人付。

平台治理别只盯着“封工具名”

Teams、WhatsApp、Zoom 这类平台当然会被推到前台。但别把问题想得太简单。

深伪检测不是万能胶。视频会议有压缩、弱网、低清摄像头、光线变化。检测模型会误判,也会被对抗。更麻烦的是,实时换脸并不天然违法。影视制作、隐私保护、虚拟形象直播,都可能用到类似技术。

如果平台只封某个工具名,换壳就能回来。

如果平台过度扫描通话内容,又会撞上隐私、加密通信和企业合规。尤其是 WhatsApp 这种强隐私叙事的平台,不能一边说端到端加密,一边大规模检查每一帧是不是 AI 脸。

真正可行的治理,会更像风险分层:

  • 对高风险账号行为做提醒,而不是只盯画面真假。
  • 对异常设备、异常登录、异常会议邀请加权。
  • 给企业管理员更多验证选项。
  • 把“活体视频”从强身份凭据改成弱信号。

技术检测只能补洞,流程设计才是地基。

我更在意那笔“入场费”之后发生了什么

Haotian AI 这类工具最值得追的,不是某个界面长什么样,也不是演示效果有多像。

关键变量有三个。

第一,它到底贵不贵。门槛高,它就是少数团伙的装备;门槛低,它就会变成诈骗脚本里的普通插件。

第二,它有没有被接入标准化话术。诈骗真正可怕的地方,从来不是单个骗子有多聪明,而是流程可复制:名单、话术、视频、收款、洗钱,一环接一环。

第三,企业是否真的改审批规则。很多公司嘴上讲安全,流程上仍然相信“视频里看起来像老板”。这不是技术问题,是组织惰性。出事前嫌麻烦,出事后再加制度,历史一直这么写。

早年电报、电话、传真、电子邮件刚进入商业世界时,都曾被当作效率工具,也都很快被诈骗者拿来套利。技术扩张的第一批红利,往往不是最守规矩的人吃到。今天的视频会议也一样,只是把旧戏换成了 AI 脸。

这里不需要神化 Haotian AI。它未必是最强的,也未必是最大的。但它指向的方向很清楚:远程信任不能再偷懒。

过去的视频确认,像一枚便宜印章。以后它只能算一个线索。

真正硬的确认,必须回到多因素、独立渠道、权限隔离和流程留痕。看得更久没用,验得更硬才有用。

这也是我对这件事的判断:问题不在某一张假脸,而在我们太久以来把“露脸”误当成了“本人”。模型看着更强,产品反而更虚;安全感不是被 AI 偷走的,是被偷懒的流程先抵押出去的。