第四范式创始人戴文渊:人工智能发展面临三个挑战

澎湃新闻记者 王心馨
2020-07-09 22:13
来源:澎湃新闻

7月9日,世界人工智能大会(WAIC)云上峰会正式拉开帷幕。在下午的科学前沿全体会议上,多位世界范围内最顶级的AI专家探讨技术趋势。

在“人工智能的未来挑战与突破”圆桌环节,第四范式创始人兼首席执行官戴文渊、香港科技大学的张潼教授、新南威尔士大学的Toby Walsh教授、札幌市立大学校长中岛秀之以及英国帝国理工学院数据科学研究所所长郭毅可共同探讨AI未来。

“人工智能的未来挑战与突破”圆桌论坛现场

在演讲中,戴文渊谈到了当下人工智能发展面临的三个挑战。

第一个挑战是数据科学家门槛高、数量少。

戴文渊指出,这是企业在AI应用中面临的普遍问题。过去五年,第四范式把很多时间花在自动机器学习(AutoML)的研究上,就是要降低技术复杂性,让普通开发者,比如Java工程师、Python程序员,也可以使用AutoML来开发足够好的人工智能,这对于在有限的数据科学家资源下实现更多AI应用是至关重要的。

戴文渊举了个例子,一家餐饮巨头企业,想把业务从线下搬到线上。传统来看,他们的门店大部分在线下,但在疫情之后,有95%的业务是电子渠道获取的。此前他们会通过门店员工给消费者发放线下消费券的方式,给用户做推荐,提供增值服务。但如果是通过电子渠道,这样大的任务量,是不可能通过人工和人力来完成的。

这样的场景其实非常适合用人工智能技术来解决,AI可以充分利用线上的用户行为数据,实现个性化的营销以及精准匹配的推送。

“但核心问题是我们现在数据科学家数量远远不够,就算是MIT的数据科学家也不能够解决所有企业的所有需求和问题。当开始收集线上数据构建AI模型时,数据科学家的缺失便是横亘在AI道路上一座难以逾越的大山。所以我们必须要研发低门槛的人工智能工具,让普通人也能使用AI技术,应对企业数据科学家缺乏、AI生产力不足的挑战。”戴文渊说。

第二个挑战来自数据隐私保护。

戴文渊指出,即便是有数据科学家,或者通过AutoML降低了AI的门槛,但缺少数据隐私保护技术,AI应用也会面临严重问题。在大数据当中如何保护用户的隐私,这是AI的第二个挑战。

目前,可用的高质量数据依然稀缺,这就需要通过迁移学习把数据中的知识从一个领域迁移另一个新领域,保证AI在新领域的应用及效果。第四范式在迁移学习领域积累了很多优秀的算法,但我们一直坚持系统本身需要解决好隐私的问题,AI基于数据得出的一些结论被应用是可以被大家接受的方式,前提是这些结论并没有记录个人具体的数据。“最近几年我们在迁移学习隐私保护领域取得了比较大的突破,能够把知识从一个领域迁移到另外一个领域,同时也不会导致隐私暴露。今年年初,第四范式先知率先通过了欧盟GDPR认证,成为国内第一款通过该认证的AI平台产品。”

第三个挑战是AI算力成本。

戴文渊在演讲中指出,顶尖的互联网公司每年要花费上千亿在搜索引擎、推荐引擎上,这是由于AI发展所带来的算力成本激增,然而很少有传统企业能接受如此高的成本。

目前,AI体系中硬件成本居高不下,但AI不仅是硬件体系,而是硬件+软件融合发展的体系,软件的设计必须要基于硬件的特点,硬件的设计也必须基于软件的算法。“我们发现如果采用软硬件深度融合优化的方式,不止性能会提高十倍,成本也会大幅降低。”戴文渊说。

以第四范式服务的某零售企业推荐场景为例,过去需要采用88台传统服务器才能支撑AI业务,采用软硬一体的方式后降为8台,TCO(总拥有成本)降低了90%。

    责任编辑:李跃群
    校对:张亮亮