脸书AI翻译主管加盟阿里达摩院,让翻译引擎不只会背字典

澎湃新闻记者 王心馨
2018-05-21 15:11
来源:澎湃新闻

机器翻译领域里的竞争愈发激烈,这一点从各大公司对人才的争夺上就可以看出。

5月21日,阿里巴巴宣布,Facebook(脸书)应用机器学习部AI翻译团队主管黄非博士入职阿里巴巴达摩院。在达摩院机器智能技术实验室,黄非和同事推动人工智能(AI)翻译在新零售、跨境电商、视频等领域的实时翻译应用。

黄非

“选择从Facebook来到阿里,主要是因为这里有着丰富的应用场景,能给AI翻译学科带来更广阔的研发和想象空间。”黄非说。

黄非介绍,主流商业AI翻译引擎都基于文本,进行海量比较、学习。这种单一维度的数据分析方法,面临模型的学习效率低下等瓶颈。基于阿里丰富的应用场景,黄非和同事将尝试建立包括图片、图像、声音等多模态数据维度的翻译架构,使得AI翻译的学习过程,更接近人的学习语言过程。

“人学习语言,不是简单背字典,而是掌握图像、声音等字词延伸内容后,理解字词使用的环境以及背后含义。而目前的AI翻译引擎,可以说是海量学习、比对网上的‘双语文本数据字典’,这样的学习效率其实并不高。而基于多模态的翻译架构,将综合学习字词语义以及相关的图像、语境等含义, 力求更接近人类学习语言,理解世界的方式。”黄非表示。

阿里近年来海外引进的科学家

除了黄非外,此前曾在加拿大国家研究委员会从事机器翻译研究的陈博兴博士,以及美国印第安大学终身教授、曾在美国雅虎从事信息检索工作的刘晓钟博士也加入达摩院机器智能实验室自然语言学习(NLP)团队。

据阿里达摩院机器智能技术NLP团队负责人司罗介绍,NLP团队现有近百人分布在中国、美国、新加坡等实验室,30%以上人员有博士学历,团队还在招贤纳士。

达摩院是阿里巴巴2017年11月宣布成立的研发机构,布局量子计算、机器学习、基础算法、网络安全、视觉计算、自然语言处理、人机自然交互、芯片技术、传感器技术、嵌入式系统等研发领域。马云曾表示未来将为该机构投入超过1000亿元。

    校对:余承君