AI识别2000年前烧焦卷轴,破译希腊哲学家对快乐的思考
·赫库兰尼姆曾被公元79年的火山爆发所掩埋,18世纪出土的赫库兰尼姆卷轴已被烧焦,研究者通过AI技术识别出其中内容,包含了希腊哲学家对快乐的思考。
·这一成就点燃了通常进展缓慢的古代研究世界。除了数百份等待识别的赫库兰尼姆卷轴外,AI也可用于研究包裹木乃伊的材料上的信息,揭示普通古埃及人的生活。
这十五列文本来自能够阅读的第一卷卷轴的末尾。该卷轴仍有大约95%待阅读。
人工智能技术可能对我们理解古代世界产生革命性的影响。
大约2000年前,维苏威火山喷发掩埋了一部烧焦的莎草纸卷轴,一组学生研究人员最近利用AI破译了其中的希腊文字内容,发现一部此前不为人知、讨论快乐的哲学作品。
当地时间2月5日,“维苏威挑战赛”赛事官方宣布,破解莎草纸卷轴文本的3名学生来自埃及、瑞士和美国,分享了70万美元大奖。他们识别了卷轴上的2000多个希腊字母,相当于一份卷轴5%的内容。这一成就点燃了通常进展缓慢的古代研究世界,学者们认为,这将使古希腊和古罗马诗歌、戏剧和哲学作品的发现量成倍增加。
“其中一些文本可能会完全改写古代世界关键时期的历史。”古典学家、赫库兰尼姆协会主席罗伯特·福勒(Robert Fowler)对媒体表示, “这就是现代西方世界的起源社会。”
AI识别碳化的上古卷轴
赫库兰尼姆(Herculaneum)卷轴藏于意大利赫库兰尼姆一座豪华罗马别墅的图书馆中,于18世纪出土。赫库兰尼姆被称为“时光冻结之城”,与庞贝古城都被公元79年的维苏威火山爆发所掩埋。该别墅被认为属于凯撒的岳父、参议员卢修斯·卡尔普尔尼乌斯·皮索·卡索尼努斯(Lucius Calpurnius Piso Caesoninus)。这座图书馆是古罗马时代遗留下来的唯一一座图书馆,这些碳化的卷轴也是古罗马时代保存下来的珍贵藏书。
1752年在赫库兰尼姆考古发掘中首次发现了约1800份卷轴。在被发现后的几个世纪里,人们试图打开这些发黑的卷轴,结果一部分卷轴被毁,变成碎片。这些古老的卷轴大多保存在意大利那不勒斯国家图书馆,少部分保存在巴黎、伦敦和牛津。
直接展开卷轴的后果就是卷轴变得稀碎。
美国肯塔基大学计算机科学家、“维苏威挑战赛”联合创始人布伦特·西尔斯(Brent Seales)近20年来一直试图解读这些文本,希望打开这座“隐形图书馆”。他的团队开发了以数字方式打开卷轴的软件,用三维计算机断层扫描(CT)图像“虚拟地打开”卷起来的莎草纸。但绘制卷轴的表面图像耗时,而且在CT扫描中,用于书写卷轴的碳基墨水与莎草纸的密度相同,因此无法在成像中进行区分。
西尔斯团队想知道机器学习模型是否可以被训练来“打开”卷轴并区分出墨水,但这项工程对他的小团队来说是一个艰巨的任务。所幸,硅谷企业家纳特·弗里德曼(Nat Friedman)找到了西尔斯,建议开放挑战,还捐赠了一笔钱。
2023年3月,“维苏威挑战赛”正式发起。赛事设定了一个大奖,要求在2023年底前,在每段140个字符、总共4段文字中,破译85%以上的字符。实际上赛事提供了2000多个字符供识别。西尔斯团队则向公众发布了扫描结果和代码。
一项关键的创新出现在去年年中,当时美国企业家和前物理学家凯西·汉默(Casey Handmer)在扫描中注意到一种微弱的纹理,这种纹理形成了希腊字母的形状。
就读于美国内布拉斯加大学林肯分校的21岁本科生卢克·法里托(Luke Farritor)利用这些纹理训练机器学习算法,发现了古希腊语“porphyras”,意为“紫色”,获得了大奖。在柏林的埃及博士生优素福·纳德(Youssef Nader)以更清晰的图像紧随其后,获得第二名。与法里托、纳德同属一个团队的还有苏黎世联邦理工学院机器人专业的学生朱利安·席利格(Julian Schilliger)。这些图像被披露出来以后,莎草纸古文稿学者们开始争分夺秒地分析文本。
被识别文本探讨快乐来源
赫库兰尼姆别墅里奢华的图书馆藏书颇丰,此前一些已知的卷轴内容是伊壁鸠鲁学派的希腊哲学家菲洛德谟(Philodemus)的作品。
一份正面和背面都有希腊文的卷轴曾经被成像技术识别出隐藏的内容,研究成果2019年发表在《科学进展》杂志上。那份卷轴上的内容是《学院历史》的草稿,而这份草稿的作者正是菲洛德谟。
先前被打开的赫库兰尼姆卷轴的大部分内容都与伊壁鸠鲁哲学学派有关。尽管此次被识别的文本没有提到作者的名字,但福勒认为,作者仍是菲洛德谟,“风格非常粗糙,是他的典型特征,主题是他擅长的。”
获奖者识别出的卷轴。
识别出的几段文本揭示了哲学家对快乐的思考——食物和其他物品的稀缺或丰富如何影响它们带来的快乐。
文本讨论了快乐的来源,涉及音乐和食物,也讨论了从各种元素组合中体验到的快乐是归功于主要部分还是次要部分、是丰富还是稀缺。“就食物而言,我们不会马上相信稀缺的东西一定比丰富的东西更令人愉快。”作者写道。
“我认为他在问这样一个问题:在各种各样的事物中,快乐的来源是什么?是主导元素、稀缺元素,还是两者混合本身?”福勒解读称。
而其余卷轴中可能蕴藏更多的希腊哲学。据《自然》报道,一些已经被打开的拉丁文卷轴覆盖了更广泛的主题,很可能找到希腊诗人荷马和萨福遗失的诗歌和文学作品。
“这是赫库兰尼姆莎草纸学和希腊哲学革命的开始。” 那不勒斯费德里科二世大学莎草纸古文稿学者费代丽卡·尼古拉迪(Federica Nicolardi)表示。
挑战赛的下一步是破译整部作品。弗里德曼已经宣布了2024年的“维苏威挑战赛”,第一个能够识别已经扫描出的四个卷轴的至少90%的团队,将获得10万美元大奖。研究人员需要完全自动化追踪每卷莎草纸表面,并提高对受损最严重部分的墨水检测。
除了数百份等待识别的赫库兰尼姆卷轴外,此次研究成果也意味着,机器学习技术可用于研究其他类型的隐藏文本,如包裹在木乃伊上的莎草纸,上面的信息可能包括信件、房契、洗衣单和税收收据等内容,可揭示普通古埃及人的生活。
此次成果也可能引发是否应对赫库兰尼姆别墅进一步调查的争论。赫库兰尼姆别墅的整个楼层从未被挖掘过,福勒和美国密歇根大学安娜堡分校莎草纸古文稿学者理查德·扬科(Richard Janko)确信,别墅的主图书馆从未被发现,地下可能还有数千卷卷轴。