牛津 All Souls 2025 试卷：AI 时代，精英教育开始考“人还剩什么”

核心摘要 Summary

牛津 All Souls College 于 2025 年 10 月 9 日发布 2025 年 General Examination 试题，共 4 页，分 General Paper I 与 II，考生需答 3 题。
题目把 AI、人类性、民主、艺术、市场、性别、历史与社会政策放进同一张卷子。
真正的信号不是牛津又出怪题，而是顶级人文选拔正在把门槛压到一句话：当知识和表达都能外包，人还靠什么被识别。

内容导图 Mind Map

AI时代选拔

人靠判断被识别

试卷信号

人文选拔承压

题目组合

AI与制度同卷

考点转移

从知识转向立意

评价反向

押注不可模板化

标准化扩张

顺滑表达贬值

风格重估

压力下显取舍

能力门槛

判断力成稀缺

写作证据

需显责任与边界

复杂处理

反例与冲突入场

受影响者

学生与知识工首当其冲

学习训练

限时立论和追问

工作交付

补足依据与轨迹

后续变量

评价成本决定落地

筛选动作

现场写作或回归

组织取舍

是否愿为判断付费

牛津 All Souls College 发布了 2025 年 General Examination 试题。PDF 标注日期为 2025 年 10 月 9 日，题为 Oxford All Souls College General Examination，共 4 页，分 General Paper I 与 General Paper II，考生需答 3 题。

这份卷子值得看，不是因为题目猎奇。它更像一张 AI 时代的人文压力测试：知识量不再稀缺，顺滑表达也不再稀缺，考试只能去压更难代工的东西——判断力、语言控制力、人格痕迹和承认复杂性的能力。

这份试卷考了什么：AI、人类性和制度想象被放在一起

All Souls 的 General Examination 不是普通知识竞赛。它更看重考生能否在陌生题目里快速立论、拆解概念、处理反例，并把文章写成一个有判断的人写出来的东西。

2025 年这份卷子里，AI 题尤其醒目。但它没有停在“技术会不会取代人”这种浅层问题上，而是追问：当机器会写，人类写作还剩什么证据价值。

题目方向	代表题信息	实际考点
AI 与人类性	“论文版图灵测试”：证明你是人类	语言里是否有判断、犹豫、节制和责任
AI 与风格	“Is style the last refuge against AI?”	风格能否抵抗模板化生成
古典思想与科技权力	Socrates and Elon Musk	古典思辨如何处理当代技术人物与权力
火星殖民	设计 1 万人的第一座火星殖民地	制度设计、人口构成、治理想象
技术与社会政策	围绕 Esther Duflo 的技术与政策题	技术式试验、微调、降本能否迁移到公共治理

同一套题还涉及民主是否过时、代词是否重要、当代艺术市场是否像郁金香狂热、避难申请者是否平等、政府是否应公开尊重司法独立等问题。

这些题的共同点很清楚：不给安全答案。背材料有用，但不够。考生必须在有限时间内暴露自己的思维结构。

重要信号：标准化在扩张，牛津反而押注不可预测性

当下多数教育和招聘正在走标准化路线。简历被关键词筛。作业被评分细则切块。面试题可以训练。邮件、总结、方案、评论都能被 AI 改得更平整。

这套系统效率高，也有代价。它会奖励“看起来正确”，压低“真正有判断”的辨识度。

All Souls 这张卷子反着来。它问风格能否抵抗 AI，问论文如何通过图灵测试，问哲学能否帮到临终者，也可以让考生为 ghosting 辩护。这些题没有稳定模板。答案太圆滑，反而像没经过人脑。

“文以载道”放在这里并不老派。AI 可以生成很多“文”，但“道”仍要看人怎么取舍、怎么负责、怎么处理冲突。风格也不是辞藻。风格是一个人在压力下把刀落在哪里。

这里必须加一道限制。它不是牛津的 AI 政策，也不是教育改革宣言。它只是一次考试题目集合。最多说明一件事：精英人文选拔已经感到 AI 的压力，并开始把不可模板化的思考放到更显眼的位置。

这和工业时代的考试变化有点像，但不完全一样。铁路、电报、打字机都曾改变知识生产速度；教育机构的反应，往往不是放弃选拔，而是把门槛移到更难复制的地方。今天的变量是 AI。它复制的不只是信息，还有语气、结构和“像样”。

Walter Benjamin 说，“每一份文明文献也是野蛮文献”。落到这里，文明的一面是更多人能写得像样；野蛮的一面是普通表达的价格会更快下跌。工具普及之后，写作者要证明的东西反而更多。

谁受影响：学生练立论，知识工作者留证据

最相关的两类人，一类是关注 AI 与教育变化的学生和教师，一类是靠文字、判断和方案吃饭的知识工作者。

学生和教师要看的不是“牛津出了什么怪题”，而是评价方式会不会从结果转向过程。只交一篇完整文章，证明力会下降。更有用的训练，是限时写作、口头追问、反例修正、草稿记录和答辩式解释。

知识工作者更该紧张。记者、研究者、咨询师、产品经理、法务、公关，很多日常产出都能被 AI 覆盖。摘要、提纲、邮件、方案、讲稿，不再能自动证明专业能力。

动作要变得具体：

对象	过去常见做法	现在更该补上的动作
学生 / 申请者	练标准范文，追求结构完整	练限时立论，保留推理过程，准备被追问
教师 / 评价者	看成稿是否清楚、规范	增加现场写作、口试、草稿链和反例讨论
知识工作者	交付一份顺滑文档	交付判断依据、取舍理由、风险边界和版本记录
雇主 / 团队负责人	用格式和表达筛能力	看人如何处理不确定问题，而不是只看成品是否漂亮

这不是要求所有人去模仿牛津。多数学校和公司没有成本做复杂评价。标准化便宜，AI 化更便宜。真正难的是，组织愿不愿意为“判断力”付出额外评估成本。

接下来该观察的不是牛津还会不会出怪题，而是大学和雇主会不会改评价动作：是否增加现场写作，是否要求解释资料来源，是否看草稿和修改轨迹，是否把口头追问重新放回筛选流程。

如果评价体系不改，AI 只会把平庸加工得更整齐。到那时，输的不是不会写的人，而是只能证明自己“写得像样”的人。

锐评 Commentary

机器能仿文，人还得立意。以后稀缺的不是会写，而是能负责地判断。

AI时代牛津 All Souls CollegeGeneral Examination教育焦虑图灵测试人类性写作风格人文选拔生成式AI判断力