一个13岁半的女孩,可能被AI看成18岁。
这不是科幻设定,而是英国内政部泄露测试报告里最刺眼的风险。英国政府计划从2027年起,在边境使用面部年龄估算AI,辅助判断寻求庇护者是否未成年。官方说它只是“额外工具”,不替代人工判断。
反常点也在这里:政府不是不知道风险。内部测试已经显示,这类工具在关键人群上偏得很明显。
英国要做什么,错判会改写什么
面部年龄估算,英文常写作FAE。简单说,就是让算法看一张脸,给出年龄估计。
它可以出现在社交平台、成人内容网站、零售场所试点里。到了边境,性质变了。这里的年龄不是消费门槛,而是法律身份。
| 关键问题 | 目前信息 | 现实后果 |
|---|---|---|
| 使用对象 | 入境寻求庇护者,很多人缺少年龄证明文件 | AI结果可能影响初步年龄判断 |
| 项目状态 | 计划延后到2027年,仍处测试、采购与审查阶段 | 不是已经全面部署 |
| 官方说法 | AI只是额外工具,不取代人工;疑似儿童会先按儿童处理 | 一线如何使用、如何培训、如何申诉仍不清楚 |
| 最大风险 | 儿童被估成成年人 | 可能失去未成年人保护,被送入成人拘留环境 |
英国边境年龄判断本来就难。工作人员要看外貌、访谈回答、整体状态,还要在高压环境下处理抵达者。
AI如果只是多一个参考,听起来像提效。可一旦分数进了流程,它就会变成人的判断锚点。尤其在时间紧、材料少、责任压力大的场景里。
对关注AI治理的人,这不是“识别准不准”的小题。它是高风险公共决策里,概率工具怎样进入行政流程的问题。
对关心移民和人权的人,重点也很具体:不要只问有没有AI,要问AI结果是否写入档案、申请人能否看到、能否质疑、错判后谁负责。
偏差不是随机的,它有方向
泄露报告测试了7个面部年龄估算算法。表现最好的那一个,仍然在撒哈拉以南非洲群体上明显更差。
这个差异不能轻描淡写。相关群体是近年通过英吉利海峡小船抵英者中的重要来源,也是在2025年被提出年龄评估最多的群体之一。
更具体的数字是:女性撒哈拉以南非洲人,平均误差达到4.6岁。报告推算,一个13.5岁的女孩存在被估为18岁的风险。
18岁不是普通数字。线的一边是儿童保护。另一边可能是成人拘留。
还有一个放大器:照片质量。
实验室里,受控条件下的好算法可以把误差压到约2.5岁。但边境不是实验室。抵达者可能刚经历危险航程,疲惫、惊恐、受创。光线、角度、设备、表情,都不会按测试标准来。
报告也承认,初次接触时拍摄的照片质量通常比后续照片更差。美国NIST多年测试同样显示,照片质量和族群差异会影响年龄估算表现。
所以,不能把所有年龄识别技术一棍子打死。低风险场景里,它可能有用。问题是英国现在讨论的是边境年龄判断,是儿童保护和成人拘留之间的分界线。
约束很清楚:模型给的是概率,不是出生证明。照片越差,人群偏差越明显,场景越高压,错误就越难被及时纠正。
“辅助工具”最容易变成责任外包
我不太买账的是一句话:AI不替代人工,所以风险可控。
行政系统里,很多自动化工具最强的能力不是更准,而是给人一个看似客观的借口。边境人员本来就压力大、时间少、培训参差不齐。过去英国独立边境监察报告也批评过人工年龄评估存在记录差、视觉判断敷衍、解释不足等问题。
在这样的流程里塞进AI分数,它很容易从“参考”变成“背书”。人还是签字的人,但判断重心已经被机器挪过了。
政府当然有现实压力。确实有人可能谎报年龄,移民系统也承受政治压力。可压力不能自动兑换成技术正当性。
尤其在内政部已经知道系统对某些群体更差之后,继续推进测试和采购,就不只是算法问题了。它更像治理激励问题。
“天下熙熙,皆为利来。”放在这里,不是说每个官员或供应商都在逐利,而是边境科技采购、反移民政治叙事、行政效率压力,会自然推着系统往一个方向走:把复杂的人变成可处理的数据,把责任摊薄在模型、流程和供应商之间。
官方也不是完全没补救。材料显示,政府称会让英国国家物理实验室做独立审查,也讨论过用更高年龄阈值来减少误差,比如不直接卡18岁,而是识别是否低于20岁。
这些比硬上好。但还不够。
接下来最该盯的不是发布会怎么说,而是四件事:
- 一线人员会不会被要求参考AI结果,参考到什么程度;
- AI估算是否进入个人档案,是否影响后续程序;
- 申请人能否知道自己被AI评估过,并提出质疑;
- 针对已知族群和性别偏差,是否有明确纠错和责任机制。
对AI治理团队和公共政策研究者,动作也很明确:把这个案例当成高风险AI采购的压力测试,盯流程、阈值、审计和申诉,而不是只看算法平均准确率。
对移民法律援助和人权组织,重点应放在证据链上:当事人是否被告知、照片如何采集、AI结果如何记录、人工判断是否真正独立。没有这些细节,“辅助”两个字就太轻了。
这件事最让人不安的地方,不是英国想试一项新技术。是它已经看见偏差,还想把偏差包装进制度流程。
技术可以辅助治理。但在边境这种地方,错误从来不会平均分配。它会先落到最没有能力反驳系统的人身上。
