AI首次读取维苏威火山烧焦的古代卷轴

scientific 20231019

  • 人工智能
  • 机器学习
  • 古籍修复
一名21岁的计算机科学专业学生在全球范围内的一场竞赛中胜出,成功读取了古罗马城市赫库兰尼姆(Herculaneum)一卷碳化羊皮纸卷轴中最初的文本内容。该卷轴因公元79年的火山喷发而无法解读,这场火山喷发也掩埋了附近的庞贝城。这一突破可能使数百份文本重现于世,这些文本来自古希腊罗马时期唯一保存完好的图书馆。来自内布拉斯加大学林肯分校的卢克·法利托(Luke Farritor)开发了一种机器学习算法,成功识别出卷轴上几行希腊字母,其中包括“πορϕυρας”(porphyras),意为“紫色”。法利托利用细微的表面纹理差异训练他的神经网络,从而突显墨水痕迹。“当我看到第一张图像时,我非常震惊,”意大利那不勒斯大学的纸莎草文研究者费德丽卡·尼科拉迪(Federica Nicolardi)说。她是法利托研究成果评审学术委员会的成员之一。“这简直就像一个梦想成真,”她说。“现在,我终于能从卷轴内部看到一些东西了。”公元79年10月,维苏威火山的喷发掩埋了赫库兰尼姆,卷轴被20米厚的火山灰覆盖。早期尝试打开这些羊皮纸导致大量碎片产生,学者们一度担心这些卷轴将再也无法展开或读取。“它们都是被压碎的,非常难以处理,”尼科拉迪说。维苏威挑战赛(Vesuvius Challenge)设立了多个奖项,其中最高奖项为70万美元,奖励能够阅读出四段或以上文本内容的参赛者。10月12日,组织者宣布法利托因在4平方厘米的羊皮纸区域中成功识别出超过10个字符,获得了4万美元的“首个字母”奖。柏林自由大学的研究生尤瑟夫·纳达尔(Youssef Nader)以第二名获得1万美元的奖励。**奢华的图书馆**“最终在卷轴内看到字母和词语,这非常令人激动,”威尼斯Ca’ Foscari大学的古希腊罗马历史学者西奥·索默施切尔德(Thea Sommerschield)表示。这些卷轴是在18世纪发现的,当时工人在一座可能属于凯撒岳父家族的奢华别墅中发现了它们。索默施切尔德表示,解读这些羊皮纸可能会“彻底改变我们对古代历史和文学的理解”。大多数今天所知的古典文本,是通过抄写员在几个世纪中反复复制形成的。相比之下,赫库兰尼姆图书馆中的作品来自其他任何来源都没有的直接作者手稿。直到现在,研究人员只能研究那些被打开的碎片。一些拉丁文作品已被识别,但大多数内容涉及希腊文本,与伊壁鸠鲁哲学学派有关。其中包括伊壁鸠鲁本人撰写的《论自然》的部分内容,以及一位鲜为人知的哲学家菲洛德谟斯(Philodemus)关于恶习、音乐、修辞和死亡等主题的作品。有学者认为,这个图书馆原本可能是菲洛德谟斯的工作资料库。目前仍保存完好的约有600卷羊皮纸,其中大部分存放在那不勒斯国家图书馆,少数存放在英国和法国。此外,别墅的下层尚未被发掘,或许还有更多的羊皮纸等待发现。计算机科学家布伦特·希尔斯(Brent Seales)帮助设立了维苏威挑战赛。他和团队花了多年时间,利用X射线计算机断层扫描技术(CT扫描)开发方法,将那些几乎无法展开的薄层“虚拟展开”并将其可视化为一系列平面图像。2016年,希尔斯当时在肯塔基大学任职,他报告称,他们使用该技术成功解读了以色列恩-盖迪(En-Gedi)的一卷碳化羊皮纸,揭示了第三或第四世纪撰写的一段《利未记》——这是犹太《托拉》和基督教《旧约》的一部分。不过,恩-盖迪卷轴上的墨水含有金属成分,因此在CT扫描图像中会发出明亮的光。而赫库兰尼姆卷轴的墨水是碳基的,基本由炭和水组成,墨水和羊皮纸在扫描中的密度几乎相同,因此完全无法识别。希尔斯意识到,即使没有亮度的差异,CT扫描仍可能捕捉到墨水覆盖区域的微小纹理差异。为了验证这一想法,他训练了一个人工神经网络,用于识别赫库兰尼姆打开片段的X射线图像中的字母。2019年,他将两卷完整的卷轴从法国的法兰西学院带到位于英国牛津附近的钻石同步辐射光源设施(Diamond Light Source),以最高分辨率(4至8微米每3D像素)进行扫描。然而,解读完整的卷轴仍然是一项巨大任务,因此团队将所有扫描数据和代码公开,并启动了维苏威挑战赛。“我们都一致认为,与其保留一切,不如尽快解读出卷轴的内容,”希尔斯说。很快,大约1500支团队通过游戏聊天平台Discord展开讨论和合作。奖项分为多个阶段,每当达成一个里程碑,获胜的代码就会向所有人开放以供继续使用。法利托从小就对历史感兴趣,并自学了拉丁语,因此他很早便参与了挑战。与此同时,希尔斯的团队也在进行虚拟展开工作,向参赛者发布了平面图像以便分析。关键的一刻出现在6月下旬,当时一位参赛者指出,在某些图像中,墨水在肉眼中偶尔可见,这种微小的纹理后来被称为“裂纹”。法利托立即专注于这些“裂纹”,寻找更多可能的字母线索。8月的一个晚上,他正在参加聚会时收到通知,一个新的图像片段被释放了,而且“裂纹”非常明显。他通过手机连接网络,并运行了他的算法。一小时后,他回家的路上拿出手机,屏幕上显示着五个字母。“我当时兴奋地跳了起来,”他说。“天哪,这真的能成功!”从那时起,他只用了几天时间就完善了模型并识别出赢得奖项所需的10个字母。尼科拉迪也表示非常激动。“‘紫色’这个词尚未出现在已打开的赫库兰尼姆卷轴中。在古罗马,紫色染料非常珍贵,是用海螺的腺体制成的。因此,这个词可能指的是颜色、服饰、能够负担得起染料的等级,甚至可能是这些软体动物。”她说。“但更重要的是,我们成功读取了任何内容,”尼科拉迪补充道。这一进展“使我们有可能恢复整卷文本的内容,包括标题和作者,从而识别和确认这些作品的年代。”**看见不可见的**伦敦谷歌DeepMind的科学家亚尼斯·阿赛尔(Yannis Assael)将维苏威挑战赛描述为“独特且鼓舞人心”。但他指出,这一项目是更广泛趋势的一部分,即人工智能(AI)在研究古代文本方面的应用越来越广泛。例如,去年,阿赛尔和索默施切尔德发布了一款名为Ithaca的AI工具,旨在帮助学者确定未知的古希腊铭文的年代和来源,并填补文本中的空白。该工具如今每周能收到数百次查询,并且类似的AI技术正被应用到从韩语到阿卡德语(古代美索不达米亚使用的语言)等语言中。希尔斯希望机器学习能够开启他所谓的“隐形图书馆”,指的是那些物理上存在但无人能看见的文本,包括中世纪书籍封面上使用的羊皮纸、被后续书写遮盖的重写纸,以及用于制作古埃及木乃伊箱和面具的旧羊皮纸碎片。然而,目前所有人的目光都集中在维苏威挑战赛上。大奖的截止日期为12月31日,希尔斯形容当前气氛为“毫无限制的乐观”。法利托本人也已经将他的模型应用于卷轴的其他部分,并看到了更多字符的显现。本文经授权转载,首次发布于2023年10月12日。

查看全文

点赞

scientific

作者最近更新

  • 我们进化的历史可以教会我们人工智能的未来
    scientific
    2023-11-11
  • “ChatGPT检测器”以前所未有的准确率识别人工智能生成的论文
    scientific
    2023-11-11
  • 人工智能需要规则,但谁将拥有制定规则的权力?
    scientific
    2023-11-07

期刊订阅

相关推荐

  • 传感器应该推进人工智能实现整体进化

    2018-12-07

  • AI结合智能手机传感器 可预测人类压力水平

    2019-07-10

  • 简单的智能玻璃揭示了人工视觉的未来

    2019-07-12

  • 英特尔开发出含800万神经元的类脑芯片系统

    2019-07-18

评论0条评论

×
私信给scientific

点击打开传感搜小程序 - 速览海量产品,精准对接供需

  • 收藏

  • 评论

  • 点赞

  • 分享

收藏文章×

已选择0个收藏夹

新建收藏夹
完成
创建收藏夹 ×
取消 保存

1.点击右上角

2.分享到“朋友圈”或“发送给好友”

×

微信扫一扫,分享到朋友圈

推荐使用浏览器内置分享功能

×

关注微信订阅号

关注微信订阅号,了解更多传感器动态

  • #{faceHtml}

    #{user_name}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 查看评论 回复

    共#{comment_count}条评论

    加载更多

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} #{reback} 回复

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 回复

  • 关闭
      广告