数据科学家发现,《麦克白》让人感到诡异的原因竟是一单词?

大数据文摘出品

来源:medium

《麦克白》是一部令人细思极恐的戏剧。

长期以来,戏剧演员们一直对出演《麦克白》感到怀疑,因为演出中总是充满了事故和死亡。

如今,演员们更是直接将其称为“苏格兰悲剧”。因为故事的基调是邪恶的,而且你能看到黑魔法、女巫、血肉模糊的幽灵和行走的森林。

但《麦克白》的粉丝们经常表示,《麦克白》最诡异的地方还不在于此。

有演员和评论家们指出,当你大声朗读《麦克白》时,你会感觉你的声音、嘴巴和大脑在犯一些小错误。在潜意识中,你会觉得这部剧的声音有些奇怪,令人害怕,仿佛莎士比亚以某种方式在每一句台词中都编织了一丝惊悚的感觉。

George Walton Williams认为,这种“持续的威胁感”和“恐怖感”还弥漫在一些看似无害的场景中。

这也引起了数据科学家们的注意,他们用科学的方式对这种现象进行了解释。

论文链接:

https://www.academia.edu/8108283/The_language_of_Macbeth

研究人员发现,《麦克白》之所以会给人带来这样的感觉,是因为莎士比亚一次又一次地使用一个特定的词的不寻常方式。

“THE”。

最初,Jonathan Hope和Michael Witmore通过阅读有关该剧的学术著作,寻找了各种假设,他们思考了莎士比亚在《麦克白》中语言的一些比较明显的怪异之处。

比如女巫是如何用扬抑格四音步说话的(“Bubb-le | bubb-le, | toil and | trou-ble”),这与其他人截然不同(“So fair | and foul | a day | I have | not seen.”)。但是,女巫们并没有经常出现在舞台上,她们奇怪的发音并没有“污染”整部剧。

然后Hope和Witmore转到学者们在历史上对《麦克白》提出的另一个观点,即该剧有大量的重复。

女巫们谈到了战斗用到了“lost and won”这样的表达,Duncan进门时也使用了这些词语;当麦克白夫人第一次问候麦克白时,她使用的措辞与女巫们第一次问候麦克白时非常相似。

Hope和Witmore得出结论,“重复是该剧的一个特色”。

这让他们感到奇怪,也许他们应该对《麦克白》做一个词频分析,这样他们就能知道哪些词语在重复出现。

于是,他们对剧中词语的“对数可能性(log-likehood)”做了分析。“对数可能性”是衡量一个词的使用频率高于或低于正常水平的一个指标。他们将《麦克白》中的用词情况与莎士比亚的整体写作进行了比较。

结果显示,对数可能性越高,说明莎士比亚在《麦克白》中使用该词的频率越高...

当然,你会看到有些词的使用频率不同寻常的词,其中包括“knock”“cauldron”“tryant”“weird”“trouble”“dagger”“fear”和“horror”。

但问题是,这并不能解释发生了什么。当然,莎士比亚使用这些词的频率比正常的要高,但它们出现的频率并没有高到改变整个戏剧语言的口感,它们的过度出现也不太令人惊讶。

随后,Hope和Witmore突然意识到了,有一个词是相当奇怪的。

虽然“The”在英文中十分常见,但毫无疑问,在《麦克白》中,“The”是被过度使用了。

在重新梳理这部戏剧后,Hope和Witmore注意到了一种模式。

如下图所示,这个场景是麦克白夫人在说话,麦克白夫妇变得紧张不安,他们被夜里的一些声音吓了一跳,麦克白夫人如此解释这些声音:

可以感觉到,麦克白夫妇谈论猫头鹰的方式很奇怪。

想象一下,我们在树林里散步,突然听到一声鸣叫。我可能会说,“啊是一只猫头鹰”,注意是“一只猫头鹰”而不是“那只猫头鹰”。

通过对“The”的运用,麦克白夫人以一种有趣但又令人毛骨悚然的方式,向读者和观众暗示,她已经知道是什么猫头鹰了。

对于角色来说,这是一种非常奇怪的说话方式。这会使读者和我们自己的感觉以及我们自己对世界的认识有一点疏离。我们会疑惑,天啊,也许我真的认识那只猫头鹰,这到底是怎么回事?

Hope和Witmore对此还指出了其他的意义。通过说“那只猫头鹰”,麦克白夫人使这只鸟看起来像“一种笼统的、神话的或谚语的猫头鹰,猫头鹰由此成为了一个概念,而不是一个东西”。

同样的例子还有很多,比如麦克白夫人在辅导麦克白如何撒谎时,这么说到:

这里的“the serpent”和猫头鹰的表达如出一辙。

这是关于《麦克白》一个非常有趣的发现。当你知道这些后,再次回去阅读文本,你就会像进入了一种X光视野,到处都会发现莎士比亚对“the”的极致运用。

这显然不是《麦克白》令人不安的唯一原因,像所有好的艺术一样,它是复杂的,不能被简化的文学效果。

尽管如此,这也是一次十分有效的使用数据分析来思考文学的方法之一。数字人文学科领域通常涉及使用数据分析来研究书籍,如果把文学作为一个大的旧袋子来分析,可能会掩盖使艺术成为艺术的东西。更糟糕的是,这可能感觉是对传统人文学科的贬低,是学术界试图将一切科技化的苛责症状。

但Hope和Witmore在这项工作中所展现出来的,是真正有意义的。他们首先思考了一个让莎士比亚迷困惑了几个世纪的现象,做了一些数据分析,指出了“the”这个词。

为了弄清楚为什么“the”的关键所在,他们不得不回去仔细地重读该剧,进行非常丰富的逐行文学分析。

计算作为一组新鲜的视角存在,它会告诉人类应该把注意力放在哪里,但最关键的是,仍然要靠人类自己去发现其中的意义。

相关报道:

https://onezero.medium.com/how-data-science-pinpointed-the-creepiest-word-in-macbeth-3150995d3808

原标题:《数据科学家发现,《麦克白》让人感到诡异的原因竟是一个单词?!》