公元 79 年,维苏威火山把赫库兰尼姆的纸草卷烧成了黑色硬块。它们保存下来了,但也几乎失去了可读性:一碰就碎,硬拆就是毁文物。

现在,Vesuvius Challenge 团队说,他们第一次在不物理展开实物的情况下,完整虚拟展开并读出了其中一卷:PHerc. 1667。不是几个零散词,而是幸存内芯从头到尾的连续文本。更难得的是,数据和代码也一起公开了。

这次到底读出了什么

对象这次给出的信息还要保留的限制
PHerc. 1667约 1.4 米、约 22 栏希腊文被连续读出读到的是幸存内芯,不是完整原始卷轴
内容判断倾向于伦理学哲学论著,偏斯多葛传统目前仍是预印本结果,需继续校勘
末栏线索提到 Aristocreon,与 Chrysippus 传统相关文本仍有破损和缺口
方法链条相位衬度 X 射线微断层扫描、几何重建、虚拟展平、机器学习识墨、纸草学家复核不是 AI 独立破解古希腊文

PHerc. 1667 也不是完好无损的“时间胶囊”。19 世纪、1969 年和 1980 年代的物理展开尝试,已经破坏了外层。今天读出的,是剩下的连续部分。

另外两卷提供了关键验证。PHerc. Paris 4 的更高分辨率数据,让墨迹在 3D X 射线数据里直接可见,并与 2023 年获奖读数一一对应。PHerc. 139 则读出了题名和作者归属:Philodemus 的《论诸神》第八卷。它说明,这套方法不只是在“看见”卷轴,还能先判断封闭卷轴里到底是什么。

真正的分水岭,不是认字,是把流程做出来

我更在意的,不是“AI 又立功了”,而是这件事终于从展示样品变成了方法。

赫库兰尼姆纸草卷最麻烦的地方,在于墨和碳化纸草太像。肉眼看不见,普通扫描也不够。团队用的是 ESRF 的高分辨率相位衬度 X 射线微断层扫描,先找出卷轴内部一层层纸草的几何结构,再虚拟展平,最后用机器学习去增强墨迹信号。

这条链路里,没有谁能单独把事做完。

  • 成像给物理证据
  • 几何重建给页面
  • 机器学习给可疑墨迹
  • 纸草学家给转写和判断

“工欲善其事,必先利其器。”这句话放在这里很合适。不是工具替代了学者,而是工具把学者带到了此前到不了的现场。

所以我不太买账“AI 读古卷”这种说法。它把最难的组织协作压扁了。真正值钱的,不是某个模型突然通灵,而是一套方法能被别人检查、复算、改进,再拿去读下一卷。

谁会受影响,接下来该看什么

对关注 AI 和科学发现的人,这件事更像一个公开基准,而不是一则神话。

读者 / 使用者直接影响更现实的动作
AI / 机器学习团队看到一个真实、复杂、可复核的识别任务关注公开数据集、错误模式和可复现性,不要只看演示视频
科学成像 / 数字人文团队看到成像、重建、识别、校勘可以接成一条链评估这套流程能否迁移到别的卷轴或类似脆弱文物
古典学与纸草学研究者获得更多文本和题名线索继续校勘、比对、修正读法,而不是把预印本当终局
开放科学支持者看到公开数据和代码的硬价值盯住数据是否持续开放、代码是否还能复现、模型是否能被他人接上

对做工具的人来说,最该盯的是三件事:

  • 能不能读更多卷
  • 能不能在更差的卷轴上也读出来
  • 成本能不能降到可持续

如果这三项都过不了,今天的结果就只是一次漂亮演示。它会留在新闻里,不会留在方法里。

对古典学、数字人文和开放科学读者,这次的意义更直接。过去,很多卷轴是“保存着,但不能读”。现在,它们开始变成可逐卷处理的文本对象。门槛还在,专家也还在,争议也不会少,但知识不再只靠运气从裂缝里漏出来。

这很像很多技术史里的老剧情。新工具刚出现时,总有人把它吹成终点。真正改变局面的,往往是它能不能被别人拿去用、拿去验、拿去继续做下去。今天这件事,离“终点”还远,离“可复制”近了很多。

两千年前的火山把书封进黑暗里。今天把它们带出来的,不是神迹,是一条终于接通的工作流。器成,事才算开始。