AI无法解决这个著名的谋杀谜题

scientific 20230420

  • 人工智能
  • 自然语言处理
  • murder mystery
人工智能程序能够分析和生成文本,正在改变我们阅读和学习的方式。为了解析文本,AI模型会像侦探一样仔细研究语言线索,例如词语选择等,以发现它们之间的联系。但如果这些线索是有意模糊和令人困惑的呢?我试图通过挑战AI开发者解决一个已有近百年历史的谜题——1934年出版的《该隐的下颌骨》(Cain’s Jawbone)来回答这个问题。这本书以一种神秘的方式出现在我的生活中,仿佛是为一位文学侦探准备的。2022年10月的一个下午,一个没有附带便条或回邮地址的随机包裹被送到了我的门口。我之前从未听说过那本书,但通过谷歌搜索,我了解到《该隐的下颌骨》不仅是一部凶杀悬疑小说,更是一个让人头疼的大脑谜题。这本书故意以所有页面都打乱顺序的方式出版;要解开这个谜题,读者首先必须重新排列这些页面,然后说出六名凶手及其受害者。这个魔鬼般的情节的作者(不出所料)是一位谜题专家。爱德华·马瑟斯(Edward Mathers)曾以笔名“托克马达”(Torquemada)为《观察家报》编写填字游戏。他出版《该隐的下颌骨》正值所谓侦探小说的黄金时代,但在该书绝版前,只有两个人成功破解了它。2019年,出版平台Unbound Publishing的联合创始人约翰·米奇森(John Mitchinson)在英国一家文学博物馆偶然发现了一本该书及其解答。米奇森决定重新印刷这本100页的谜题书。“我当时说,‘这太棒了,它是一部侦探小说,那按照顺序排列应该不会太难吧?’”他回忆道。结果证明,这非常非常难。在过去的几年里,只有另外四个人成功破解了这个谜题。随后,这本书因两位TikToker尝试使用一个色彩斑斓的“谋杀墙”重新排列页面而走红。它的新热度促使米奇森在最初的5,000册基础上加印了更多副本。当我收到《该隐的下颌骨》时,我没有专门腾出墙面来贴这些页面,而是我和丈夫将它们铺在了客厅的床上。在一个昏暗的夜晚,我们仔细阅读了这本书中那些华丽且故意模糊的语言时,我建议使用人工智能算法来破解这本小说。尝试解开《该隐的下颌骨》。来源:Austen Hughes 因为我不是软件专家,所以我开始寻找一家愿意解决这个谜题的人工智能公司。但大多数AI并没有特别训练过如何重新排列书页,或分析上世纪30年代英语的语言特点。最终,我联系上了Zindi,这是一家位于非洲的公司,举办人工智能竞赛,5万名数据科学家利用算法解决谜题并赢得奖金。Zindi有兴趣举办这次竞赛,且在Unbound的同意下,我创建了2022年《该隐的下颌骨》凶杀谜题竞赛;我们将这本90岁的书数字化,并向全球挑战者发起挑战,要求他们使用自然语言处理(NLP)算法来重新排列页面。像著名的ChatGPT这样的自然语言处理算法,通过将文本的上下文和语言与它接收到的训练数据进行比较来理解文本中的信息。这些算法可以将每个词转换为“标记”,然后分析这些标记如何在整体中融合,从而分析前所未见的文本。这有助于人工智能算法快速有效地分析文本,无论是文学作品还是科学报告。我自豪地抵制了使用人工智能来破解谁寄给我这本书这一谜题,而是通过发送短信和在Instagram上发帖来揭穿这位神秘人物。在我们的比赛中,参赛者使用了一种名为BERT的现有NLP模型,这是由谷歌开发并在一个开源库中提供的,可以对其进行修改以适用于特定用途。“这些模型……经过大量数据训练,这些数据是模型创建者能够获取到的,然后它们被优化以执行特定指令,”南加州大学计算机科学系研究副教授乔纳森·梅(Jonathan May)说。为了优化这些模型用于此次任务,我们提供了阿加莎·克里斯蒂的第一部推理小说《斯泰尔斯庄园奇案》作为训练数据,因为这部小说的创作时间与《该隐的下颌骨》相同,并且语言风格相似,同时还包含了经典推理小说的背景线索。人工智能在小说创作领域有着悠久的历史,包括推理小说。1973年,计算机科学家谢尔顿·克莱恩(Sheldon Klein)提出了“自动小说作家”,声称它可以在不到20秒的时间内生成2100字的推理小说。此后,程序员和工程师们通过更多数据不断改进这些模型的输出。“某种程度上来说,推理小说是简单的,”英国开放大学教育技术研究所的名誉教授迈克·夏普尔斯(Mike Sharples)说。“它有一个标准的情节结构:发现尸体、侦探登场、你还有误导性线索,等等。”这种情节结构不仅对急于写故事的作家有帮助,理论上也可以帮助人工智能语言程序重新排列那些被打乱的故事情节——尽管目前尚未实现。不幸的是,《该隐的下颌骨》为语言分析算法提出了终极挑战:这个故事不仅完全打乱了顺序,而且其设计就是为了干扰读者。例如,书中语言高度风格化——米奇森形容它为“后现代主义诗歌”——而且刻意模糊,以使页面排序尽可能困难。此外,故事中充满了虚假线索,例如一些角色的假名和误导性名字,这可能会让AI模型和人类解谜者都感到困惑。结果是,没有任何AI开发者成功破解了谜题——尽管其中一些人取得了一定进展。来自南非的计量经济学家M.G.费雷拉(M.G. Ferreira)是AI竞赛的获胜者之一,他的得分最高,为42%。这意味着他的程序正确排列了100页中的42页。“NLP确实有一定的理解能力,比如知道雷雨通常是一起发生的,”费雷拉说。“但问题是这本书是用虚假线索故意误导你的。这打破了NLP的理解能力。”他解释说,为了破解谜题,AI需要人类介入,查看上下文并确定哪些观点相关联。“沿着这个方向继续前进,我们最终是可以解决全部问题的。但到那时,NLP所起的作用将非常小,而人类的介入将占据主导地位,所以我称之为‘机器辅助’。”这次凶杀谜题竞赛揭示出,目前的人工智能语言程序虽然可以完成令人印象深刻的任务,但它们还无法与波洛(Poirot)一较高下。这些模型在缺乏上下文的情况下分析事物的能力较差,这可能会对希望使用NLP分析古代语言的研究人员造成困难。由于一些早已消逝的文明的历史记录很少,缺乏上下文使得AI难以学习如何翻译这些失落的语言。至少,这次经历帮助我解决了一个谜题:我找到了寄给我这本书的人,并因此踏上了破解它谜题的旅程。结果发现,这个“罪犯”竟然是我的小学同学,一个没有社交媒体但和我一样热衷凶杀谜题的人。这是一篇观点与分析文章,作者的观点未必代表《科学美国人》的立场。

查看全文

点赞

scientific

作者最近更新

  • 我们进化的历史可以教会我们人工智能的未来
    scientific
    2023-11-11
  • “ChatGPT检测器”以前所未有的准确率识别人工智能生成的论文
    scientific
    2023-11-11
  • 人工智能需要规则,但谁将拥有制定规则的权力?
    scientific
    2023-11-07

期刊订阅

相关推荐

  • 传感器应该推进人工智能实现整体进化

    2018-12-07

  • AI结合智能手机传感器 可预测人类压力水平

    2019-07-10

  • 简单的智能玻璃揭示了人工视觉的未来

    2019-07-12

  • 英特尔开发出含800万神经元的类脑芯片系统

    2019-07-18

评论0条评论

×
私信给scientific

点击打开传感搜小程序 - 速览海量产品,精准对接供需

  • 收藏

  • 评论

  • 点赞

  • 分享

收藏文章×

已选择0个收藏夹

新建收藏夹
完成
创建收藏夹 ×
取消 保存

1.点击右上角

2.分享到“朋友圈”或“发送给好友”

×

微信扫一扫,分享到朋友圈

推荐使用浏览器内置分享功能

×

关注微信订阅号

关注微信订阅号,了解更多传感器动态

  • #{faceHtml}

    #{user_name}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 查看评论 回复

    共#{comment_count}条评论

    加载更多

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} #{reback} 回复

  • #{ahtml}#{created_at}

    #{content}

    展开

    #{like_count} #{dislike_count} 回复

  • 关闭
      广告