摘要:人工智能在解决重大难题方面的终极证明,体现在赫库兰尼姆古卷研究者的成就上。阿萨尔博士表示:“他们所进行的工作令人叹为观止。”布伦特·西尔斯教授及其在肯塔基大学莱克星顿分校的同事们,在维苏威挑战赛参与者的协助下,致力于解决一项看似不可能的任务——解读那些完全无法
人工智能在解决重大难题方面的终极证明,体现在赫库兰尼姆古卷研究者的成就上。阿萨尔博士表示:“他们所进行的工作令人叹为观止。”布伦特·西尔斯教授及其在肯塔基大学莱克星顿分校的同事们,在维苏威挑战赛参与者的协助下,致力于解决一项看似不可能的任务——解读那些完全无法展开的文本。
解读赫库兰尼姆古卷面临两大挑战。首先,这些脆弱的古卷无法被展开。西尔斯教授花费数年时间开发了“虚拟展开”技术,该技术依赖于对古卷进行高分辨率计算机断层扫描(CT),细致地手工绘制每一帧横截面中可见的表面,然后利用算法将这些表面展开成平面图像。
2015年,研究人员利用这项技术成功解读了以色列恩基底一卷烧焦且无法打开的古卷内部的完整文本,该古卷可追溯至公元三世纪左右,结果表明它来自圣经的《利未记》第11章。
隐基底卷轴共有五圈,而赫库兰尼姆卷轴的圈数则多达数百,质地薄如丝绸。为了获取极高分辨率的CT数据,研究团队将部分卷轴运送到位于牛津附近的钻石光源粒子加速器。隐基底卷轴和其他后期作品的墨水含有铁元素,在CT扫描中会发出明亮的光芒,而赫库兰尼姆卷轴的抄写员使用的碳基墨水,在扫描中却无法直接观察到,因为其密度与纸莎草纸相同。西尔斯教授及其团队意识到,尽管无法直接看到墨水,但他们或许能够通过检测其形状来识别。如果裸露的纸莎草纤维表面纹理与涂有墨水的纤维表面纹理存在细微差异,他们或许可以训练神经网络来辨识这种差异。
对于西尔斯教授的小团队而言,这项任务过于繁重,因此他们于2023年3月与硅谷企业家纳特·弗里德曼合作,发起了“维苏威挑战赛”,并提供了丰厚的现金奖励。西尔斯教授及其同事发布了卷轴表面的扁平图像,并邀请参赛者训练神经网络以寻找墨水。超过1,000个团队参与了比赛,每天都有数百人在比赛的Discord频道上讨论进展。2024年2月,计算机科学专业的学生尤素夫·纳德、卢克·法里托和朱利安·希利格因制作了16列清晰易读的文本而共同获得了70万美元的奖金。
获胜团队使用了TimeSformer,这是一种通常用于视频的变换器模型的较新变体,能够分别处理空间和时间维度。Vesuvius团队利用它将纸莎草纸的深度维度与其表面外观分开。Nicolardi及其同事随后揭示的文本被鉴定为来自之前未知的希腊哲学著作,涉及音乐、快乐和感觉,可能是伊壁鸠鲁哲学家Philodemus的作品。她表示,研究这些文本是“神奇的”。
2024年2月的维苏威火山挑战赛的获胜者在这本烧焦的赫库兰尼姆古卷中发现了近16列希腊文字。图片来源:维苏威火山挑战赛。
从那时起,在纸草学家的帮助下,参赛者一直在努力改进他们的墨水检测算法。与此同时,西尔斯教授的团队正在扫描更多的卷轴,并希望机器学习可以加快虚拟拆卷步骤。他指出,这是目前限制参赛者必须处理的数据的瓶颈。他乐观地认为,人工智能驱动的拆卷技术将及时面世,让阅读90%的四卷卷轴的人赢得2024年20万美元的大奖。
“一旦你实现了自动化,你基本上就可以规模化了。”西尔斯教授在谈到拆卷技术时说,“我们正处于这个边缘。”
实际上,西尔斯教授渴望阅读整个图书馆。赫库兰尼姆有数百卷未打开的卷轴,大部分收藏在那不勒斯,但也收藏在巴黎、伦敦和牛津。“对于纸草学家来说,这将是他们一个世纪以来从未见过的古代世界新文本。”他说道。
动画展示了如何使用墨水检测模型读取赫库兰尼姆古卷中的文字。图片来源:维苏威挑战赛。
这种方法还能打开其他无法接触的资料来源,西尔斯教授称之为“隐形图书馆”。这些资料包括隐藏在中世纪书籍封面或古埃及木乃伊包裹物内的文本,对于这些资料,“它们就在这里,我们拿着实物,但读不懂上面的文字”。该团队已经从华盛顿特区史密森尼博物馆收藏的一本未打开的埃及卷轴中获取了数据,并正在讨论分析公元七世纪在火灾中被烧毁的约旦佩特拉纸莎草纸。
此外,一些考古学家认为,赫库兰尼姆别墅图书馆的大部分藏书仍埋在地下。如果真的能发掘出来,还能发现数千卷古卷。西尔斯教授说,阅读所有古卷将是“人类历史上对古代世界最大的发现,现在,我们掌握了技术。”
来源:SENSORO升哲