英国想用AI给庇护者判年龄，最危险的是它明知会偏

核心摘要 Summary

英国计划从2027年起，用面部年龄估算AI辅助判断入境寻求庇护者是否未成年，但项目仍在测试和采购阶段，并非已经全面部署。
泄露的英国内政部测试显示，7个算法里表现最好的系统，仍对撒哈拉以南非洲群体误差更大；女性撒哈拉以南非洲人平均误差达4.6岁。
真正的问题不是AI会不会估年龄，而是政府打算把一个已知有偏差的概率工具，放进可能改变儿童处境的边境流程里。

一个13岁半的女孩，可能被AI看成18岁。

这不是科幻设定，而是英国内政部泄露测试报告里最刺眼的风险。英国政府计划从2027年起，在边境使用面部年龄估算AI，辅助判断寻求庇护者是否未成年。官方说它只是“额外工具”，不替代人工判断。

反常点也在这里：政府不是不知道风险。内部测试已经显示，这类工具在关键人群上偏得很明显。

英国要做什么，错判会改写什么

面部年龄估算，英文常写作FAE。简单说，就是让算法看一张脸，给出年龄估计。

它可以出现在社交平台、成人内容网站、零售场所试点里。到了边境，性质变了。这里的年龄不是消费门槛，而是法律身份。

关键问题	目前信息	现实后果
使用对象	入境寻求庇护者，很多人缺少年龄证明文件	AI结果可能影响初步年龄判断
项目状态	计划延后到2027年，仍处测试、采购与审查阶段	不是已经全面部署
官方说法	AI只是额外工具，不取代人工；疑似儿童会先按儿童处理	一线如何使用、如何培训、如何申诉仍不清楚
最大风险	儿童被估成成年人	可能失去未成年人保护，被送入成人拘留环境

英国边境年龄判断本来就难。工作人员要看外貌、访谈回答、整体状态，还要在高压环境下处理抵达者。

AI如果只是多一个参考，听起来像提效。可一旦分数进了流程，它就会变成人的判断锚点。尤其在时间紧、材料少、责任压力大的场景里。

对关注AI治理的人，这不是“识别准不准”的小题。它是高风险公共决策里，概率工具怎样进入行政流程的问题。

对关心移民和人权的人，重点也很具体：不要只问有没有AI，要问AI结果是否写入档案、申请人能否看到、能否质疑、错判后谁负责。

偏差不是随机的，它有方向

泄露报告测试了7个面部年龄估算算法。表现最好的那一个，仍然在撒哈拉以南非洲群体上明显更差。

这个差异不能轻描淡写。相关群体是近年通过英吉利海峡小船抵英者中的重要来源，也是在2025年被提出年龄评估最多的群体之一。

更具体的数字是：女性撒哈拉以南非洲人，平均误差达到4.6岁。报告推算，一个13.5岁的女孩存在被估为18岁的风险。

18岁不是普通数字。线的一边是儿童保护。另一边可能是成人拘留。

还有一个放大器：照片质量。

实验室里，受控条件下的好算法可以把误差压到约2.5岁。但边境不是实验室。抵达者可能刚经历危险航程，疲惫、惊恐、受创。光线、角度、设备、表情，都不会按测试标准来。

报告也承认，初次接触时拍摄的照片质量通常比后续照片更差。美国NIST多年测试同样显示，照片质量和族群差异会影响年龄估算表现。

所以，不能把所有年龄识别技术一棍子打死。低风险场景里，它可能有用。问题是英国现在讨论的是边境年龄判断，是儿童保护和成人拘留之间的分界线。

约束很清楚：模型给的是概率，不是出生证明。照片越差，人群偏差越明显，场景越高压，错误就越难被及时纠正。

“辅助工具”最容易变成责任外包

我不太买账的是一句话：AI不替代人工，所以风险可控。

行政系统里，很多自动化工具最强的能力不是更准，而是给人一个看似客观的借口。边境人员本来就压力大、时间少、培训参差不齐。过去英国独立边境监察报告也批评过人工年龄评估存在记录差、视觉判断敷衍、解释不足等问题。

在这样的流程里塞进AI分数，它很容易从“参考”变成“背书”。人还是签字的人，但判断重心已经被机器挪过了。

政府当然有现实压力。确实有人可能谎报年龄，移民系统也承受政治压力。可压力不能自动兑换成技术正当性。

尤其在内政部已经知道系统对某些群体更差之后，继续推进测试和采购，就不只是算法问题了。它更像治理激励问题。

“天下熙熙，皆为利来。”放在这里，不是说每个官员或供应商都在逐利，而是边境科技采购、反移民政治叙事、行政效率压力，会自然推着系统往一个方向走：把复杂的人变成可处理的数据，把责任摊薄在模型、流程和供应商之间。

官方也不是完全没补救。材料显示，政府称会让英国国家物理实验室做独立审查，也讨论过用更高年龄阈值来减少误差，比如不直接卡18岁，而是识别是否低于20岁。

这些比硬上好。但还不够。

接下来最该盯的不是发布会怎么说，而是四件事：

一线人员会不会被要求参考AI结果，参考到什么程度；
AI估算是否进入个人档案，是否影响后续程序；
申请人能否知道自己被AI评估过，并提出质疑；
针对已知族群和性别偏差，是否有明确纠错和责任机制。

对AI治理团队和公共政策研究者，动作也很明确：把这个案例当成高风险AI采购的压力测试，盯流程、阈值、审计和申诉，而不是只看算法平均准确率。

对移民法律援助和人权组织，重点应放在证据链上：当事人是否被告知、照片如何采集、AI结果如何记录、人工判断是否真正独立。没有这些细节，“辅助”两个字就太轻了。

这件事最让人不安的地方，不是英国想试一项新技术。是它已经看见偏差，还想把偏差包装进制度流程。

技术可以辅助治理。但在边境这种地方，错误从来不会平均分配。它会先落到最没有能力反驳系统的人身上。

英国想用AI给庇护者判年龄，最危险的是它明知会偏

AI判龄

边境试点

未全面部署

法律分界

已知偏差

高风险样本

照片变量

辅助失控

人工背书

治理激励

后续关口

流程记录

纠错责任

英国要做什么，错判会改写什么

偏差不是随机的，它有方向

“辅助工具”最容易变成责任外包