牛津 All Souls College 发布了 2025 年 General Examination 试题。PDF 标注日期为 2025 年 10 月 9 日,题为 Oxford All Souls College General Examination,共 4 页,分 General Paper I 与 General Paper II,考生需答 3 题。
这份卷子值得看,不是因为题目猎奇。它更像一张 AI 时代的人文压力测试:知识量不再稀缺,顺滑表达也不再稀缺,考试只能去压更难代工的东西——判断力、语言控制力、人格痕迹和承认复杂性的能力。
这份试卷考了什么:AI、人类性和制度想象被放在一起
All Souls 的 General Examination 不是普通知识竞赛。它更看重考生能否在陌生题目里快速立论、拆解概念、处理反例,并把文章写成一个有判断的人写出来的东西。
2025 年这份卷子里,AI 题尤其醒目。但它没有停在“技术会不会取代人”这种浅层问题上,而是追问:当机器会写,人类写作还剩什么证据价值。
| 题目方向 | 代表题信息 | 实际考点 |
|---|---|---|
| AI 与人类性 | “论文版图灵测试”:证明你是人类 | 语言里是否有判断、犹豫、节制和责任 |
| AI 与风格 | “Is style the last refuge against AI?” | 风格能否抵抗模板化生成 |
| 古典思想与科技权力 | Socrates and Elon Musk | 古典思辨如何处理当代技术人物与权力 |
| 火星殖民 | 设计 1 万人的第一座火星殖民地 | 制度设计、人口构成、治理想象 |
| 技术与社会政策 | 围绕 Esther Duflo 的技术与政策题 | 技术式试验、微调、降本能否迁移到公共治理 |
同一套题还涉及民主是否过时、代词是否重要、当代艺术市场是否像郁金香狂热、避难申请者是否平等、政府是否应公开尊重司法独立等问题。
这些题的共同点很清楚:不给安全答案。背材料有用,但不够。考生必须在有限时间内暴露自己的思维结构。
重要信号:标准化在扩张,牛津反而押注不可预测性
当下多数教育和招聘正在走标准化路线。简历被关键词筛。作业被评分细则切块。面试题可以训练。邮件、总结、方案、评论都能被 AI 改得更平整。
这套系统效率高,也有代价。它会奖励“看起来正确”,压低“真正有判断”的辨识度。
All Souls 这张卷子反着来。它问风格能否抵抗 AI,问论文如何通过图灵测试,问哲学能否帮到临终者,也可以让考生为 ghosting 辩护。这些题没有稳定模板。答案太圆滑,反而像没经过人脑。
“文以载道”放在这里并不老派。AI 可以生成很多“文”,但“道”仍要看人怎么取舍、怎么负责、怎么处理冲突。风格也不是辞藻。风格是一个人在压力下把刀落在哪里。
这里必须加一道限制。它不是牛津的 AI 政策,也不是教育改革宣言。它只是一次考试题目集合。最多说明一件事:精英人文选拔已经感到 AI 的压力,并开始把不可模板化的思考放到更显眼的位置。
这和工业时代的考试变化有点像,但不完全一样。铁路、电报、打字机都曾改变知识生产速度;教育机构的反应,往往不是放弃选拔,而是把门槛移到更难复制的地方。今天的变量是 AI。它复制的不只是信息,还有语气、结构和“像样”。
Walter Benjamin 说,“每一份文明文献也是野蛮文献”。落到这里,文明的一面是更多人能写得像样;野蛮的一面是普通表达的价格会更快下跌。工具普及之后,写作者要证明的东西反而更多。
谁受影响:学生练立论,知识工作者留证据
最相关的两类人,一类是关注 AI 与教育变化的学生和教师,一类是靠文字、判断和方案吃饭的知识工作者。
学生和教师要看的不是“牛津出了什么怪题”,而是评价方式会不会从结果转向过程。只交一篇完整文章,证明力会下降。更有用的训练,是限时写作、口头追问、反例修正、草稿记录和答辩式解释。
知识工作者更该紧张。记者、研究者、咨询师、产品经理、法务、公关,很多日常产出都能被 AI 覆盖。摘要、提纲、邮件、方案、讲稿,不再能自动证明专业能力。
动作要变得具体:
| 对象 | 过去常见做法 | 现在更该补上的动作 |
|---|---|---|
| 学生 / 申请者 | 练标准范文,追求结构完整 | 练限时立论,保留推理过程,准备被追问 |
| 教师 / 评价者 | 看成稿是否清楚、规范 | 增加现场写作、口试、草稿链和反例讨论 |
| 知识工作者 | 交付一份顺滑文档 | 交付判断依据、取舍理由、风险边界和版本记录 |
| 雇主 / 团队负责人 | 用格式和表达筛能力 | 看人如何处理不确定问题,而不是只看成品是否漂亮 |
这不是要求所有人去模仿牛津。多数学校和公司没有成本做复杂评价。标准化便宜,AI 化更便宜。真正难的是,组织愿不愿意为“判断力”付出额外评估成本。
接下来该观察的不是牛津还会不会出怪题,而是大学和雇主会不会改评价动作:是否增加现场写作,是否要求解释资料来源,是否看草稿和修改轨迹,是否把口头追问重新放回筛选流程。
如果评价体系不改,AI 只会把平庸加工得更整齐。到那时,输的不是不会写的人,而是只能证明自己“写得像样”的人。
