数说|中国 AI 期刊论文被引量世界第一,都在研究什么?

澎湃新闻记者 邹熳云 卫瑶 刘畅 舒怡尔
2021-07-08 08:30
来源:澎湃新闻

【编者按】

人工智能正像电力一般赋能各个产业,深刻地改变人类社会。中国正处于全球人工智能发展第三次浪潮的时代潮头,在2021年世界人工智能大会于上海召开之际,澎湃新闻与上海人工智能研究院联合推出《算法周刊》,将聚焦人工智能“上海高地”和中国新基建,并持续关注全球AI最前沿。

在人工智能(AI)研究上,中国是当前热度最高的国家。

今年清华大学人工智能研究院、北京智源人工智能研究院等联合发布的《人工智能全球2000位最具影响力学者报告》指出,美国早期有领先优势,但近年来中国的研究热度已经赶超美国

人工智能的研究论文就反映出了这种热度。

中国 AI 期刊论文被引量首超美国

2020年,中国 AI 期刊论文全球引用量首次超过了美国。

这是美国斯坦福大学《2021年人工智能指数报告》(以下简称“报告”)高亮的9大发现之一。报告指出,在期刊论文总数超过美国的若干年后,中国终于在被引量上也拿下了世界第一。在学术研究界,论文引用量是衡量一篇科研文献被其他机构学者认可的数据。

但报告也指出,在会议论文(conference paper)的被引量上,美国还是保持着领先地位。和期刊论文相比,会议论文相对更短,发表得更快,注重介绍研究的创新思想,同时也更容易被同行引用。

2020年,中国研究机构比美国少发了近1400篇会议论文,但被引量相差了一万多次。

中国优秀AI论文,研究基础和技术的偏多

人工智能技术,指的是用计算机程序使人造机器呈现类人类智能的技术。按照产业,这些专业术语分为三类:基础层,指算法、软件和平台,以及支撑运算的硬件;技术层,指针对目标而研发的具体技术,比如语音识别图像识别;应用层,指进入市场的落地产品,比如无人驾驶、推荐引擎等。

那我国的AI论文,大多在研究哪些方面?澎湃新闻(www.thepaper.cn)选取39所中国顶级人工智能研究院校2017到2021年被 IEEE 收录的9903篇会议论文作为样本,计算了这些论文的高频关键词。

下图每个点是一个关键词。一个点的连线越多,表示这个词和越多其他词共同出现在了论文中。点与点之间的连线越粗,则表示这两个关键词的共现频率越高。

图中共50个高频关键词。其中,出现最多的是基础层术语,共23个,比如机器学习、卷积神经网络。第二则是技术层术语,有16个,包括自然语言学习、计算机视觉等等。这就表示,我国顶级院校的 AI 研究,集中在这两个层面的偏多。

    责任编辑:吕妍
    校对:张艳