Haotian AI 被 404 Media 拿到后，视频会议的“看脸确认”该降级了

核心摘要 Summary

404 Media 在播客中称已获得中文界面的 Haotian AI 实时深伪软件，可用于 Microsoft Teams、WhatsApp、Zoom 等视频通话场景。
相比单纯讨论深伪诈骗报道的取证难度，这条线索把风险指向了更具体的工作流：远程审批、视频核验、跨境沟通都不能再把“对方露脸”当强证明。

404 Media 这次说得很具体：他们拿到了 Haotian AI，一款中文界面的实时视频深度伪造软件。它不是做一张假照片，也不是生成一段录好的视频，而是可以把使用者在 Microsoft Teams、WhatsApp、Zoom 这类通话里实时替换成别人。

这才是刺人的地方。

深伪本身早就不新鲜。真正的新变量，是它开始贴近诈骗最需要的那段链路：开会、确认身份、远程审批、催付款、改账户、过面试。以前“见个视频”还能给人一点安全感，现在这层安全感也开始漏风。

404 Media 早前关于 Haotian AI 的调查，重点更像是记者如何进入这类灰色工具圈、如何跨过那笔“入场费”。播客提供的补强，是把工具放进真实通信场景：Teams、WhatsApp、Zoom。它让问题从“有人在卖深伪软件”变成“深伪软件已经瞄准了远程信任的接口”。

目前能确定什么，不能确定什么

从 404 Media 播客摘要看，核心事实有三条：

软件名.Haotian AI。
界面语言.中文。
能力.实时视频深度伪造，可用于 Microsoft Teams、WhatsApp、Zoom 等视频通话。

404 Media 还把它放在全球诈骗活动的语境下讨论，称其是诈骗工具链的一部分。

但边界也要说清。

目前公开摘要没有给出具体受害人数、诈骗金额、受害者名单，也没有披露开发者、售价、用户规模、模型架构、算力需求、绕过平台检测的方式。也就是说，现在还不能把 Haotian AI 写成一桩已经坐实的大规模犯罪案。

更准确的说法是：它至少表明，实时换脸正在从“炫技工具”靠近“诈骗基础设施”。

这比单纯多一个软件名重要。

风险不在假脸，在它进了通话链路

过去很多深伪风险停在“内容伪造”：假照片、假视频、假社交账号。麻烦归麻烦，但互动性有限。

实时视频换脸不同。它攻击的是会议软件长期建立的默认信任：对方出现在屏幕里，能点头，能说话，能接话，于是就被当成本人。

一个简单对照更清楚：

场景	过去的风险	Haotian AI 代表的变化	影响
图片换脸	伪造头像、包装账号	进入实时视频流	欺骗从“看图”变成“交谈”
录制视频	可传播，难互动	可接入会议软件	更适合审批、面试、远程沟通
视频核验	看脸、听声、问问题	脸和声音都可能被合成或转接	视频从强凭据降为弱信号

语音克隆诈骗还有一个缓冲：你可以挂掉电话，回拨号码，找第二个渠道确认。实时视频更难处理，因为它借用了视频会议本身的权威感。

屏幕里的那张脸，曾经是远程时代的门面。现在门面也会易容。

最先被迫改流程的不是普通用户

普通用户当然会担心亲友诈骗，但最先痛的，很可能不是普通人，而是企业里的三类岗位：财务审批、安全团队、远程身份核验服务商。

跨国公司、外包团队、远程招聘、线上开户，都靠视频降低身份不确定性。可一旦“视频可见”不再可靠，流程就会变贵、变慢、变烦。

企业不太可能禁止视频会议。那不现实。

它们更可能做几件事：

高风险转账必须双人审批，不能只凭一次视频确认。
陌生会议链接不能作为身份依据。
账号重置、付款、合同签署，要回到企业通讯录、硬件密钥、已登记设备、线下回拨。
视频只做辅助证据，不再做最终证明。

这才是现实代价。

AI 工具每降低一次作恶门槛，企业流程就要多加一道闸。省下来的成本在攻击者那边，增加的成本在防守者这边。天下熙熙，皆为利来。诈骗团伙要的是转化率，企业安全要付的是摩擦费。

这笔账不会消失，只会换人付。

平台治理别只盯着“封工具名”

Teams、WhatsApp、Zoom 这类平台当然会被推到前台。但别把问题想得太简单。

深伪检测不是万能胶。视频会议有压缩、弱网、低清摄像头、光线变化。检测模型会误判，也会被对抗。更麻烦的是，实时换脸并不天然违法。影视制作、隐私保护、虚拟形象直播，都可能用到类似技术。

如果平台只封某个工具名，换壳就能回来。

如果平台过度扫描通话内容，又会撞上隐私、加密通信和企业合规。尤其是 WhatsApp 这种强隐私叙事的平台，不能一边说端到端加密，一边大规模检查每一帧是不是 AI 脸。

真正可行的治理，会更像风险分层：

对高风险账号行为做提醒，而不是只盯画面真假。
对异常设备、异常登录、异常会议邀请加权。
给企业管理员更多验证选项。
把“活体视频”从强身份凭据改成弱信号。

技术检测只能补洞，流程设计才是地基。

我更在意那笔“入场费”之后发生了什么

Haotian AI 这类工具最值得追的，不是某个界面长什么样，也不是演示效果有多像。

关键变量有三个。

第一，它到底贵不贵。门槛高，它就是少数团伙的装备；门槛低，它就会变成诈骗脚本里的普通插件。

第二，它有没有被接入标准化话术。诈骗真正可怕的地方，从来不是单个骗子有多聪明，而是流程可复制：名单、话术、视频、收款、洗钱，一环接一环。

第三，企业是否真的改审批规则。很多公司嘴上讲安全，流程上仍然相信“视频里看起来像老板”。这不是技术问题，是组织惰性。出事前嫌麻烦，出事后再加制度，历史一直这么写。

早年电报、电话、传真、电子邮件刚进入商业世界时，都曾被当作效率工具，也都很快被诈骗者拿来套利。技术扩张的第一批红利，往往不是最守规矩的人吃到。今天的视频会议也一样，只是把旧戏换成了 AI 脸。

这里不需要神化 Haotian AI。它未必是最强的，也未必是最大的。但它指向的方向很清楚：远程信任不能再偷懒。

过去的视频确认，像一枚便宜印章。以后它只能算一个线索。

真正硬的确认，必须回到多因素、独立渠道、权限隔离和流程留痕。看得更久没用，验得更硬才有用。

这也是我对这件事的判断：问题不在某一张假脸，而在我们太久以来把“露脸”误当成了“本人”。模型看着更强，产品反而更虚；安全感不是被 AI 偷走的，是被偷懒的流程先抵押出去的。

Haotian AI 被 404 Media 拿到后，视频会议的“看脸确认”该降级了

视频信任降级

线索坐实

已知能力

边界未明

风险迁移

交谈欺骗

弱化视频

企业承压

高危岗位

硬验回归

平台治理

检测有限

风险分层

后续变量

成本门槛

话术接入

目前能确定什么，不能确定什么

风险不在假脸，在它进了通话链路

最先被迫改流程的不是普通用户

平台治理别只盯着“封工具名”

我更在意那笔“入场费”之后发生了什么