产业与治理|中国计算生物学需提升专利质量,加强跨国合作

张军玲  田竞楠 许鑫
2024-08-14 12:07
来源:澎湃新闻

近年来,AI技术发展势头猛进,计算生物学作为AI发展的重要方向,正在重新定义生物医药研发的底层逻辑,作为一门源于20世纪的交叉学科,其核心使命是通过大量生物数据模拟和分析,发现生物体和生态系统的结构和功能,从而深化对生命现象的理解。在全球主要国家都在大力发展计算生物学的背景下,知悉世界其他国家的研发水平将有助于中国各部门采取相关行动,取长补短,有针对性地提高中国计算生物学的综合实力。 

一、计算生物学领域发展现状

  (1)美国主导国际市场:全球计算生物学市场正呈现出强劲的增长势头。其中,北美地区是最大的市场,美国是行业内领先国家,政府每年用于发展计算生物学的平均支出估计为1.4亿美元,美国在药物发现和开发工作上的高支出,是其保持市场主导地位的主要原因;欧洲地区是全球第二大市场,德国、英国和法国占据重要比例;亚太地区是增长最快的市场,中国和日本是药物支出的主要国家,该地区合同研究组织(CRO)的持续增长,有助于降低药物研发成本,从而推动市场规模扩大。同时,较大的化学仿制药和生物类似药生产规模,进一步刺激了计算生物学领域的市场需求。

(2)国内政策大力支持: 国家层面,国家发展改革委印发《“十四五”生物经济发展规划》中明确提出,要推动生物技术和信息技术融合创新;地区层面,北京、上海、广州、深圳等一线城市首先推动,其中上海作为生物医药科技创新实力最强、活力最足的区域之一,在计算生物学方面具有良好的发展基础,2023年5月上海市科学技术委员会发布《上海市计算生物学创新发展行动计划(2023—2025年)》,加速推动了计算生物学赋能生物医药科技创新和产业发展。

(3)相关领域投融资较热:国内对计算生物学相关公司(包括AI制药、组学、精准医疗)的投资事件主要分布在北京、上海、杭州和深圳等城市,国外主要分布在美国、加拿大、英国、以色列和印度等地区。2023 年,全球计算生物学领域发生82 起投资事件,融资金额约为93 亿人民币,深势科技、Causaly、腾迈医药、Superluminal Medicines、分子之心和本导基因等企业受到了资本市场的青睐。 

二、全球计算生物学研发水平评估

课题组参考并利用兰德公司开发的快速、开源的用于评估国家科技水平的方法,系统考察了全球计算生物学发展水平和现状。数据来源为Web of Science数据库核心合集和Derwent专利数据库,由于计算生物学是近几年发展迅速的交叉学科,故选取近五年数据进行分析,范围为2019年1月1日至2023年12月31日

(1)高影响力论文:在2019-2023年间,美国在计算生物学领域论文方面与其他国家拉开较大差距,拥有351篇(40%)高影响力科学论文,远超其他国家,占有科研成果数量上的绝对优势,中国排名第二,拥有125篇(14%)高影响力科学论文,位列第三的是英国,拥有100篇(11%)高影响力论文,随后是德国和法国,分别拥有高影响力论文77篇(9%)和54篇(6%)。可以看出,美中英三国在计算生物学领域的高影响力论文占据了近五年来计算生物学领域的半壁江山,意大利、日本、加拿大和法国在高影响力论文产出的数量方面还有待提高。

图1  全球主要国家计算生物学领域高影响力论文数量

(2)合作网络密度:在2019-2023年间,美国是网络密度最高的国家(0.298%)且遥遥领先,说明相较于其他国家,美国在计算生物学领域的研究表现出高度的连通性,国际间的合作最密切。排名二、三位的英国和德国,其合作网络密度较为接近,与后面国家拉开了较大距离。中国虽然发表论文数位列第二,但与国际间的合作连通性相较于发文量来说不高,说明中国计算生物学界的研究多集中在国内机构,不太注重跨国交流。位列中国之后的法国、意大利、加拿大和印度在高影响力论文方面的排名也相近,说明加强国际合作在一定程度上可以提高科研成果的技术水平。

(3)质量调整专利:未经调整的专利数据表明,2019-2023年间,美国在计算生物学领域产生了10988项专利(占全球专利总数的44%),从数量角度远远领先于其他国家,并且平均质量也很高,不是想象中“少而精”的存在。中国的专利数量虽然排名第二,但是经过专利质量的调整,专利产出量大幅下降,是所有纳入分析的国家中唯一负方向波动的国家,可见中国专利虽然在数量上排名可观,但是在质量上有很大的提升空间。此外,可以观察到欧洲国家的专利申请数虽然不及中国,但经质量调整后,其专利数都有所提升,可见大部分发达国家在计算生物学领域的专利质量在全球处于领先地位,中国“专利泡沫”现状的存在不利于专利的高质量发展。

表1 主要国家在计算生物学领域的专利质量调整

(4)国际科技组织能力:2019-2023年间,统计全球主要国家的文献发表机构数量和专利申请机构数量发现,美国的文献发表机构数量远高于其他国家,是其高质量文献数领先的主要原因。在统计的过程中发现,美国机构的平均文献发表数也遥遥领先,这侧面反映出每个机构的成果产出也很优秀。中国的专利申请机构数量相对较多(排名第一),同时中国也是经专利调整后数量大幅下降的国家(调整系数小于1),证明专利申请机构的数量多少与产出高质量的专利没有直接密切关系。

图2  主要国家计算生物学领域科技组织数量

(5)文献高产出机构分析:2019-2023年间,全球计算生物学领域的文献大多数来自高校,国家级别的科研机构和研究所也参与产出,社会企业等机构产出甚少。研究结果还显示,欧美等发达国家间的机构连接网络密度极高,说明欧美国家的国内外机构合作十分密切,而中国的节点密度较低,倾向于内部合作,清华大学是中国机构中国内外合作最密切的一所高校。 

三、 计算生物学领域前沿热点分析

基于论文和专利课题组进一步跟踪和分析计算生物学领域前沿热点发现:

(1)文献研究热点:用VOSviewer将关键词聚成4类,根据每类关键词的词义,可概括为4个研究主题:主题1--计算生物学的应用,包括病理诊断(diagnosis)、免疫疗法(immunotherapy)、乳腺癌(breast cancer)等;主题2--人工智能辅助的生物学,包含生物信息学(bioinformatics)、基因表达(gene expression)、蛋白质组学(proteomics)、深度学习(deep learning)等;主题3--计算生物学中的软件使用,包括系统(systems)、数据库(database)、可视化(visualization)、模型框架(framework)等;主题4--以预测功能为主的计算生物学,包括序列(sequence)、分子动力学(molecular dynamics)、二级结构(secondary structure)、结构生物学(structural biology)等。

(2)专利研究热点:运用LDA主题模型对专利摘要进行主题分类,当主题聚类数为4的时候显示结果最佳,可以看出,当前计算生物学方向的专利研究主题主要集中于计算生物学的底层技术。将其与分析所得的文献主题进行比较,可以发现目前计算生物学专利领域重点落在算法技术板块,而文献的热点更多侧重于计算生物学的实际应用,直接和医疗层面建立联系,努力为人类健康做出贡献。但任何一个领域应用的落实都离不开底层技术的基础支持,因此,高质量的专利应当为了实现应用而存在,而非“修改皮毛”、“以次充好”,不论是从知识产权保护的层面还是经济市场产品角度来看,专利质量的重要性举足轻重。未来对于计算生物学在应用上的专利研究可以加大力度,适当引入计算机领域人才或跨领域合作来加快新科研成果的产出。  

四、对上海计算生物学发展的启示

(1)加强跨国合作:与其他国家相比,中国在计算生物学领域的国际交流与合作还有待加强。一方面,中国的科研成果多以国内课题组为合作团体开展合作,跨国合作的比例较少,这也是发文机构之间的关联不如欧美国家紧密的原因之一。另一方面,美国在计算生物学领域高质量论文的产出遥遥领先于其他国家,并且在合作网络密度指标的表现上也位居首位,相反中国则表现欠佳。上海作为中国开放的桥头堡,理应加强与他国科研能力强的团队的学习交流合作,实现领域知识整合和研究的推进交流,进而突破现有的技术瓶颈,产出更多的高质量成果,推动全球计算生物学的发展。

(2)优化成果遴选指标:尽管国内在计算生物学的基础研究上取得了不错的成就,但技术转化和应用方面仍有待提高,主要表现在有效专利的质量低,在质量调整专利后,中国是在主要国家中专利质量调整系数小于1的唯二国家。上海虽然已经对专利申请数量的单一化指标要求有所改变,但能解决实际问题的专利比重还是偏小,所以建议上海能在专利申请和维护时定向支持产学研合作,鼓励将科研成果转化为实际产品和实用服务,学习借鉴海外国家相关政策法案实施科学的激励手段,对专利质量进行严格把关,真正发挥出科技力量强国的作用。

(3)建立专业人才队伍:发展新兴交叉学科计算生物学需要具备高度专业知识和技能的人才队伍,高校教育和企业员工培训都需要顺应新时代,紧跟科技发展趋势,不断更新人才培养体系,从传统的单学科教育逐渐转向交叉学科的综合能力培养,包括生物信息学、计算机科学、统计学等,同时需要吸引和留住优秀人才进行高质量科研产出,提升中国科技水平。根据前文研究热点的分析结果,可知计算生物学领域发展现今主要依赖于高级算法创新和人工智能发展,因此,未来上海要紧抓人工智能方面缺口,加强培育或是引进AI优秀人才,展开计算生物学跨学科合作,并不断优化现有算法,未来才有望抢占计算生物学全球制高点。

(4)建立健全数据共享机制:由于计算生物学高度依赖于生物医学大数据,因此需要健全的数据共享和开放机制,以促进全世界范围的科研合作和技术进步,同时要重视数据安全和隐私保护,尤其是基因数据和病例数据。一个成熟的技术领域从基础研究、技术开发、到应用推广,涉及大量的数据流动,需要一个完整的数据保护机制来支持计算生物学的发展。上海在科学数据基础设施领域已有所布局,还应进一步推动数据、算法、算力领域的协同创新,发起大科学计划。

(5)注重计算生物学在其他领域的应用:计算生物学在基因组学、蛋白质组学等领域的研究成果已经开始应用于医学诊断、治疗和药物研发,未来可以进一步将计算生物学成果应用于医疗、环保、农业甚至新能源等各个领域,通过发现并解决实际问题来推动技术进步创新,同时还能够产生可观的经济价值和社会价值。上海研究基础厚实,学科发展均衡,产业覆盖也很全面,对于提升中国在全球计算生物学领域的科技水平排名和影响力至关重要,对于计算生物学在更广阔领域应用也有一定的先天优势,值得继续关注和扩大投入。

(作者张军玲系华东师范大学经济与管理学院博士研究生,田竞楠系华东师范大学经济与管理学院硕士研究生,许鑫系华东师范大学经济与管理学院教授、博士生导师,上海高校智库主任,上咨集团创新工作室首席专家。许鑫教授持续关注新技术、新产业、新业态、新模式等新型经济形态,关心新兴技术治理,本专栏以“产业与治理”为主题,探讨科技创新在经济社会发展中的前瞻性问题。)

    责任编辑:田春玲
    图片编辑:陈飞燕
    校对:张艳