404 Media 这次说得很具体:他们拿到了 Haotian AI,一款中文界面的实时视频深度伪造软件。它不是做一张假照片,也不是生成一段录好的视频,而是可以把使用者在 Microsoft Teams、WhatsApp、Zoom 这类通话里实时替换成别人。
这才是刺人的地方。
深伪本身早就不新鲜。真正的新变量,是它开始贴近诈骗最需要的那段链路:开会、确认身份、远程审批、催付款、改账户、过面试。以前“见个视频”还能给人一点安全感,现在这层安全感也开始漏风。
404 Media 早前关于 Haotian AI 的调查,重点更像是记者如何进入这类灰色工具圈、如何跨过那笔“入场费”。播客提供的补强,是把工具放进真实通信场景:Teams、WhatsApp、Zoom。它让问题从“有人在卖深伪软件”变成“深伪软件已经瞄准了远程信任的接口”。
目前能确定什么,不能确定什么
从 404 Media 播客摘要看,核心事实有三条:
- 软件名.Haotian AI。
- 界面语言.中文。
- 能力.实时视频深度伪造,可用于 Microsoft Teams、WhatsApp、Zoom 等视频通话。
404 Media 还把它放在全球诈骗活动的语境下讨论,称其是诈骗工具链的一部分。
但边界也要说清。
目前公开摘要没有给出具体受害人数、诈骗金额、受害者名单,也没有披露开发者、售价、用户规模、模型架构、算力需求、绕过平台检测的方式。也就是说,现在还不能把 Haotian AI 写成一桩已经坐实的大规模犯罪案。
更准确的说法是:它至少表明,实时换脸正在从“炫技工具”靠近“诈骗基础设施”。
这比单纯多一个软件名重要。
风险不在假脸,在它进了通话链路
过去很多深伪风险停在“内容伪造”:假照片、假视频、假社交账号。麻烦归麻烦,但互动性有限。
实时视频换脸不同。它攻击的是会议软件长期建立的默认信任:对方出现在屏幕里,能点头,能说话,能接话,于是就被当成本人。
一个简单对照更清楚:
| 场景 | 过去的风险 | Haotian AI 代表的变化 | 影响 |
|---|---|---|---|
| 图片换脸 | 伪造头像、包装账号 | 进入实时视频流 | 欺骗从“看图”变成“交谈” |
| 录制视频 | 可传播,难互动 | 可接入会议软件 | 更适合审批、面试、远程沟通 |
| 视频核验 | 看脸、听声、问问题 | 脸和声音都可能被合成或转接 | 视频从强凭据降为弱信号 |
语音克隆诈骗还有一个缓冲:你可以挂掉电话,回拨号码,找第二个渠道确认。实时视频更难处理,因为它借用了视频会议本身的权威感。
屏幕里的那张脸,曾经是远程时代的门面。现在门面也会易容。
最先被迫改流程的不是普通用户
普通用户当然会担心亲友诈骗,但最先痛的,很可能不是普通人,而是企业里的三类岗位:财务审批、安全团队、远程身份核验服务商。
跨国公司、外包团队、远程招聘、线上开户,都靠视频降低身份不确定性。可一旦“视频可见”不再可靠,流程就会变贵、变慢、变烦。
企业不太可能禁止视频会议。那不现实。
它们更可能做几件事:
- 高风险转账必须双人审批,不能只凭一次视频确认。
- 陌生会议链接不能作为身份依据。
- 账号重置、付款、合同签署,要回到企业通讯录、硬件密钥、已登记设备、线下回拨。
- 视频只做辅助证据,不再做最终证明。
这才是现实代价。
AI 工具每降低一次作恶门槛,企业流程就要多加一道闸。省下来的成本在攻击者那边,增加的成本在防守者这边。天下熙熙,皆为利来。诈骗团伙要的是转化率,企业安全要付的是摩擦费。
这笔账不会消失,只会换人付。
平台治理别只盯着“封工具名”
Teams、WhatsApp、Zoom 这类平台当然会被推到前台。但别把问题想得太简单。
深伪检测不是万能胶。视频会议有压缩、弱网、低清摄像头、光线变化。检测模型会误判,也会被对抗。更麻烦的是,实时换脸并不天然违法。影视制作、隐私保护、虚拟形象直播,都可能用到类似技术。
如果平台只封某个工具名,换壳就能回来。
如果平台过度扫描通话内容,又会撞上隐私、加密通信和企业合规。尤其是 WhatsApp 这种强隐私叙事的平台,不能一边说端到端加密,一边大规模检查每一帧是不是 AI 脸。
真正可行的治理,会更像风险分层:
- 对高风险账号行为做提醒,而不是只盯画面真假。
- 对异常设备、异常登录、异常会议邀请加权。
- 给企业管理员更多验证选项。
- 把“活体视频”从强身份凭据改成弱信号。
技术检测只能补洞,流程设计才是地基。
我更在意那笔“入场费”之后发生了什么
Haotian AI 这类工具最值得追的,不是某个界面长什么样,也不是演示效果有多像。
关键变量有三个。
第一,它到底贵不贵。门槛高,它就是少数团伙的装备;门槛低,它就会变成诈骗脚本里的普通插件。
第二,它有没有被接入标准化话术。诈骗真正可怕的地方,从来不是单个骗子有多聪明,而是流程可复制:名单、话术、视频、收款、洗钱,一环接一环。
第三,企业是否真的改审批规则。很多公司嘴上讲安全,流程上仍然相信“视频里看起来像老板”。这不是技术问题,是组织惰性。出事前嫌麻烦,出事后再加制度,历史一直这么写。
早年电报、电话、传真、电子邮件刚进入商业世界时,都曾被当作效率工具,也都很快被诈骗者拿来套利。技术扩张的第一批红利,往往不是最守规矩的人吃到。今天的视频会议也一样,只是把旧戏换成了 AI 脸。
这里不需要神化 Haotian AI。它未必是最强的,也未必是最大的。但它指向的方向很清楚:远程信任不能再偷懒。
过去的视频确认,像一枚便宜印章。以后它只能算一个线索。
真正硬的确认,必须回到多因素、独立渠道、权限隔离和流程留痕。看得更久没用,验得更硬才有用。
这也是我对这件事的判断:问题不在某一张假脸,而在我们太久以来把“露脸”误当成了“本人”。模型看着更强,产品反而更虚;安全感不是被 AI 偷走的,是被偷懒的流程先抵押出去的。
