科技期刊开放数据会带来学术影响力的提升吗?

马亮
2021-02-05 11:54
来源:澎湃新闻

最近,首都医科大学校长饶毅实名举报中国科学院院士裴钢的论文涉嫌造假,引发舆论广泛关注。中国科学院学部科学道德建设委员会发表了处理意见,认为不存在造假嫌疑,因此不再进行调查。但是,由此引发学术界和全社会对科研诚信建设的反思,却仍然是弥足珍贵的一场风波。

近些年来,中国科技创新突飞猛进,但是科研诚信问题也如影随形。无论是论文抄袭剽窃,还是国际期刊撤稿,都反映了科研诚信建设仍然是任重道远的问题。确保研究过程的透明度和研究结果的可复制性,是维护科研诚信的重要措施。因此,越来越多的科研基金会、学术期刊和出版社,要求作者公开和共享研究过程中产生的数据,以供学术同行的审查和核验。“开放科学”运动由此掀起一股浪潮,推动越来越多的学术机构支持开放数据、开放同行评议过程、开放获取期刊等。

开放科学是一个值得推崇的发展方向,但是在实际推进过程中却面临许多阻力。作者担心论文的数据无法得到知识产权保护,可能被他人盗用。期刊需要承担开放数据涉及的大量行政工作,可能害怕作者因为需要开放数据而不愿投稿。与此同时,开放科学能否真正提升学术期刊的影响力,仍然是一个有待回答的问题。

笔者与山东大学国际创新转化学院副研究员张立伟合作完成的一项研究在《科学计量学》发表,分析了科技期刊开放数据对学术论文的影响力的作用。《中国工业经济》是国内社会科学中文期刊第一个也是目前唯一一个公开论文数据和代码的期刊,为我们研究开放数据提供了案例。该刊编辑部在2016年11月发布公告,决定自2016年第11期开始,在其网站公开论文的原始数据、案例研究材料、数据处理程序、以及附件等资料,致力于打造良好的学术生态,构建良好的学术监督机制。

学术论文的影响力主要反映在被其他论文引用方面,因此被引量是一个较好的学术影响力评价指标。要想评估一本期刊上发表的论文的被引量是否由于推行开放数据政策而得到提升,我们需要将其同其他同类期刊进行比较。这类似于《中国工业经济》实施了一项政策实验,它是实验组,而其他同类期刊是参照组,据此可以利用合成控制法进行政策评估。为此,我们收集了37本中文经济学期刊,对其2001-2019年的数据进行分析。

研究显示,《中国工业经济》的开放数据政策显著提高了论文的被引量。平均来说,一篇开放数据的论文当年和次年的被引量可以提高1到4倍。比如以2019年为例,《中国工业经济》发表的论文在发表当年的被引量平均为1.0次,而同类期刊合成的结果是0.4次,数据开放使其被引量整整提高了0.6次。与此同时,即便是此前没有开放数据的论文,也受到期刊声誉的“光环效应”而“雨露均沾”,它们的被引量也显著增加了。以《中国工业经济》在2018年发表的论文为例,它们在发表后第二年的被引量是平均7.1次,而同类期刊只有4.1次,也整整提高了3.0次。

这项研究表明,学术期刊如果希望提升其学术影响力,那么开放数据不啻为一个百利而无一害的良策。之所以开放数据可以提升学术期刊的影响力,就在于数据公开在提升论文声誉、提高发表门槛和发挥教育传播作用这三个方面效果明显。

首先,敢于将研究数据开放的论文可以赢得学术同行的尊敬,并使人们相信这项研究是可信赖的,由此增加论文的被引量。

其次,期刊要求开放数据,会在无形之中提高论文的发表门槛,并使滥竽充数的研究不敢尝试和无法发表。

最后,论文开放的数据和程序可以供希望学习研究方法的学者再次利用,也会间接提高学术论文的影响力。

此外,开放数据还有利于提升期刊论文的下载量和浏览量,使论文得到更大范围的传播和扩散。

目前,国外学术期刊的开放数据政策越来越流行,不仅自然科学和工程领域如此,经济学、政治学等社会科学也已有很多尝试。但是,中文期刊在开放数据方面的进展还远远不够,仅有《中国工业经济》、《社会》等少数期刊敢于做“第一个吃螃蟹的人”。与此同时,大量期刊都是鼓励性地要求作者公开数据,而很少强制要求作者公开数据,也在一定程度上影响了开放数据的政策效果。所以,为了鼓励更多科研人员“把论文写在祖国的大地上”,中文期刊需要加大力度推动开放科学运动,持续不断地提升学术期刊的声誉,使更多作者愿意投稿中文期刊。

(作者马亮为中国人民大学国家发展与战略研究院研究员、公共管理学院教授)

    责任编辑:蔡军剑
    校对:栾梦