微软小冰写诗:人工智能对这个世界“漠不关心”

夏永红/华南师范大学哲学研究所
2017-05-24 16:27
来源:澎湃新闻

近日,微软公司开发的聊天机器人小冰创作的诗集《阳光失了玻璃窗》出版,引起了广泛讨论。通过诗歌语料数据库的排列组合,进行诗歌创作并不是新鲜事。机器人小冰的超越之处在于它似乎具有本体论(ontology)知识,可以构建不同诗歌意象之间的本体论关系,再根据简单的关联分析进行组合。这样的诗歌可以称得上“创作”吗?如果暂且不能算,那么机器人有一天真的可以获取处理自然语言的能力吗?研究科学技术哲学的夏永红老师认为,要表征全部常识对于机器人来说是天方夜谭,只有海德格尔意义上的“此在”(dasein),即有着自己的历史、周围世界和身体,承受并操劳着整体的世界,才会关注类似善与恶、罪与罚、生与死这样的问题,才能体悟世间的情感,理解文本的意义,才可以真正地阅读和创作。 

数据库写诗:

机器人小冰的诗歌距离“创作”有多远?

英国大诗人拜伦有一个女儿名叫奥古斯塔·阿达·拜伦(Augusta Ada Byron),后来被称为洛夫莱斯夫人(Lady Lovelace)。但她的天赋发展却与父亲南辕北辙,没有成为诗人,而是喜欢上数学,成了人类历史上的第一个程序员——这算是诗歌与计算机的第一次相遇。洛夫莱斯夫人在回忆录中记载了英国数学家查尔斯·巴比奇设计的一台分析机——后来它被视为现代通用计算机的鼻祖,并为其设计了一个可以求解伯努利方程的程序;同时,她对计算机的发展趋势也有着极为准确的预言:计算机不仅能用来求解数学问题,甚至可以用来创作复杂的音乐。

然而,作为诗人的女儿,也许为了给艺术家保留一些尊严,她仍然坚持认为,即便分析机可以作曲,其创造性也不能归诸于分析机,而应该归诸于工程师。这样,她在人工智能发明100多年前,就预先提出了一个反人工智能的论证: “分析机无权说它创造出什么新的东西,它所能做的都是那些我们知道怎样命令它去执行的事情。”这个论证后来被概括为创造力论证。

1950年,图灵在他的著名论文《计算机器与智能》中提及了洛夫莱斯夫人的论证,他提出了一个非常有力的反驳:我们可以用一台学习机来让机器具有真正创造力,先编程一个模拟儿童心灵的程序,然后通过特定的训练手段让它逐渐学习,获得成人水平的智能。图灵所说的学习机,也就是后来的机器学习。2010年以后,机器学习迎来了一个空前的发展高潮。图灵所预见的学习机不仅试图作曲,甚至还试图模仿洛夫莱斯夫人的父亲拜伦的工作——写诗。诗歌与计算机再一次相遇了。2016年,谷歌就发明了一款可以自动写诗的机器人,而最近几天,微软公司开发的聊天机器人小冰“创作”的诗集《阳光失了玻璃窗》出版。

那么,小冰的诗歌是否真的展现了创造力呢?这里先亮明我的观点:小冰没有表现出任何的创造力。

根据人工智能专家玛格丽特·博登的观点,创造力可以定义为我们产生新奇观念或制品的能力,它分为三种类型:组合性的、探索性的和变革性的。所谓组合性创造力,也就是寻常的观念被以不寻常的方式组合在一起;探索性创造性则是通过对既定的规则作出细微的改变,以发展出某种风格的潜力;变革性创造性可能更加符合我们直觉上对创造力的理解,它试图打破既有的风格,创造出以往不曾存在的风格。我们不妨以写诗为例来说明这一点,如果一个诗人通过意象组合,创造出前所未有的意向组合,那么我们便可以说他的诗表现了创新性;如果他在十四行诗的一般规则之内,通过调整韵式、改变节律来使形式更好地适应他要表现的内容,这就体现为探索性创造性,比如莎士比亚开创的莎体十四行诗;如果他彻底打破了传统格律诗的规则,开创了一种完全不同的诗体,从而可以表现更复杂的内容,这就是变革性创新,如惠特曼开创的自由诗体。

虽然我没有看过小冰的整部诗集,但根据网上流传的几首作品来看,小冰显然并不具有探索性创造力和变革性创造力,因为它的诗很难看出有任何想要表现的内容,更遑论风格。但小冰似乎学会了进行一些前所未有的意象拼贴,比如“她嫁了人间许多的颜色”,或许可以认定它具有组合性创造性?果真如此吗?

事实上,机器作诗并不是什么新奇的事情。通过构造一个诗歌语料的数据库,再做一些词句与词句的关联分析,就可以随机组合地“创作”出一首诗来。如果为某些意象或句子添加某些标签,程序甚至能创作出特定“风格”的诗。这种排列组合式的作诗机在很多年便已经流传网络。在赵丽华诗歌事件之后,甚至激起了广大网友应用作诗机批量创作诗歌、恶搞现代诗人的热情。

虽然现在的报道并没有描述小冰的具体技术细节,但根据零星的消息来看,小冰似乎具有本体论(ontology)知识,这可能是与之前网络上流传的作诗机不同的地方。在人工智能中,为了表征世界的存在结构,需要建模一套本体论来刻画事物的类别、属性及其相互关系。比如,对于叶子,就需要明确它构成了树木的一部分,对于树木,需要明确它在种类上属于植物这个类别。这里就涉及到了两种不同的关系,一是物质上的组合-构成关系,二是逻辑上的归类关系。如果人工智能要恰当地表征树木,这些关系都需要在本体论构建中界定清楚。可以推测,小冰的本体论构建了不同诗歌意象之间的本体论关系,再根据简单的关联分析,将相关的意象组合排列,就可以创作一首诗来。

然而,并不是所有新奇的意向组合都可以被认定是创新的,只有那些符合人类文化语境的组合才是有意义的。将无意义的组合去除,保留有意义的,这里面就涉及到人工。虽然小冰诗集的宣传人员宣称原模原样地保留了小冰的诗作,没有做出任何更改。但我们注意到,小冰创作了一万多首诗歌,只选了130多首出版。从网络上流传的几首诗来看,机械拼接不合情理的创作比较多,而那些未入选诗集的诗作,是否会有更多不合情理的拼接组合呢?因此,小冰所表现的所谓组合创造力,只是一种随机组合加人工筛选,并不是真正的创造力;就算有创造力,那也只是人工筛选在其中发挥了作用。

计算机处理自然语言的不可能性:

语言的意义依赖于我们对常识和情境的理解

相比于计算机在作曲、绘画等方面的相对成功,计算机在文学创作方面的进展要缓慢得多,这源于自然语言处理的巨大困难。要让计算机理解自然语言已经非常困难的,让它自动生成自然语言就更加困难。现有的自然语言处理程序都无法完好地捕捉自然语言的这三个典型特征:句法、相关项和语境。

人工智能自然语言处理上的信念最初来自于乔姆斯基的转化生成语法理论。在乔姆斯基的语言学理论中,人类具有对语言的先天知识——一套原初的普遍语法规则,它就像一个自动引擎,可以驱动语言在特定条件下从这些规则中生成出来。因此,对自然语言的句法分析,曾经被视为自然语言处理的密匙。然而,非常不幸的是,人工智能中的句法分析被证明是非常困难的。在历史上,威诺格拉德(Terry Winograd)曾经设计过一款名为SHRDLU的人机对话系统,它可以接收人类的自然语言指令,通过对语言的句法分析和语义分析,在经过逻辑推理之后做出相应的操作,比如将桌上的一个红色的圆形积木叠到绿色的方形积木上。然而,这样的系统只能处理一个玩具世界(toy world)。对于复杂的现实世界和日常语言而言,它是无能为力的。后来威诺格拉德也对此心灰意冷,彻底改变了对句法分析的信念,读起了海格德尔的《存在与时间》,试图从实存主义现象学中寻找人工智能设计的灵感。而现在的大多数自然语言处理也都是基于统计的,不仅句法分析被认为是不相关的,甚至语义分析也是不重要的。比如在现在的机器翻译中,关注的焦点在于词语、短语和句子,而不是句法。

但自然语言理解面临的最大难题甚至还不是句法,而是如何处理语义的整体论特征,其中最重要的就是相关项(常识)和情境。根据人工智能哲学家豪格兰德(John Haugeland)的观点,句子的语义并非是原子语义的组合,而是和作者意图、日常知识、语言的情境以及实存者的生命等四重因素相关的。这里不讨论作者意图,我们先来看常识和情境。比如“李白在画里”,我们要理解这句话的意义,首先需要知道“画是图像的某种载体”,从而确定它所要表达的不是类似于“李白在房间里”这样的空间包含关系,而是“画里的人像是李白”。这里的“画是图像的某种载体”就是句子理解的相关项或常识。但有时候,要理解这句话的意义不仅依赖于常识,还依赖于情境。假设这样一段散文,描写小明漫步在一个风光旖旎的山巅,这句“李白在画里”表达的意思就与之前完全不同了,它是一种隐喻,表达的是“李白周围的风景美如画”。在绝大多数文学作品中,语言的意义正是如此这般地依赖于我们对常识和情境的理解。

由此,我们也就不难理解小冰为什么可以创作“诗歌”,但在创作小说时却完全失败了。诗歌虽然被视为最能展现人类创造力的艺术形式,但也恰恰最容易写作。因为诗歌对于语法并没有很高的要求,有的诗句为了创造出陌生化的效果,甚至要打破日常语法;对于日常常识的要求也不高,只需要对常用的意象建构一个简单的本体论就可以了;因为诗歌通常很短,也就不太需要把握整个文本的语境。而小说的写作,无论是对于句法,还是对于相关项和情境,要求都比诗歌要高得多。以常识为例,小说描述了人类的生活往往涉及到大量的常识,比如“摔下悬崖会受伤(但可能不会死)”、“被剑刺中会受伤(但可能不会死)”、“师傅的关门女弟子是我的小师妹”、“杀了我师傅的人是我的仇人”等等。要创作小说首先要构造出这些常识的本体论,而这是非常困难的。1984年开始的Cyc项目试图表征人类的全部常识,然而,三十多年过去了,这一项目虽然仍在运作,却远未看得到商用的前景。因为人类的常识实在太多,而且各个常量之间的关系异常复杂,要表征全部常识几乎是不可能的。可见,创作小说对于机器而言就是天方夜谭,它可能会机械地组合一些既有的故事情节,但要实现真正的创作,在现有技术条件下是不可能的。

但即便诗歌如此容易创作,小冰的“创作”也仍然不能称之为创作。AlphaGo虽然可以战胜世界上最优秀的围棋选手,但它却缺乏赢棋的理由(reason),同样,小冰的创作,暂且不论其水平如何,它也缺少创作的理由。人类之所以要赢棋,或者是为了获得名声和尊重,或者是为了赢得奖金,或是为了证明自身的力量;而人类的创作,往往是为了表达某种观念,表现某种情感。但无论是AlphaGo还是小冰,都缺乏对这些情感和观念的体悟,因为它们对这个世界根本上是“漠不关心”的。

文本的整体意义除了意图、常识和情境,在根本上依赖于实存者的生命。即便像东郭先生和狼这样简单的文学故事,要阅读或创作它,不仅要把握这个故事里的常识、情境,更要体悟“同情心泛滥”、“恩将仇报”这样一些微妙的情感。而只有海德格尔意义上的“此在”(dasein),即有着自己的历史、周围世界和身体,承受并操劳着整体的世界,才会关注类似善与恶、罪与罚、生与死这样的问题,才能体悟世间的情感,理解文本的意义,才可以真正地阅读和创作。根据豪格兰德的观点,这样一个实存者,只有通过具身的和嵌入的(embodied and embeded)人工智能才能实现。当计算机成为大地的栖居者,它就真的可以写诗了。

    校对:张艳