Nature子刊:曹云龙团队利用蛋白质语言模型预测SARS-CoV-2的时空分辨率进化动态
编辑丨王多鱼
排版丨水成文
在早期阶段识别 SARS-CoV-2 等病原体的新兴优势变异株对于有效的公共卫生应对至关重要,然而现有方法无法用于实时监测。
2026 年 5 月 27 日,北京大学/昌平实验室曹云龙研究员、北京大学简繁冲博士作为共同通讯作者(杨斯捷、罗霄伟为论文共同第一作者),在 Nature 子刊 Nature Microbiology 上发表了题为:A deep mutational scanning-informed protein language model predicts SARS-CoV-2 evolution dynamics with spatiotemporal resolution 的研究论文。
该研究开发了一个基于深度突变扫描的蛋白质语言模型——DeepCoV(DMS-Empowered Evolution Prediction of CoronaVirus),通过整合深度扫描突变(DMS)功能数据、进化序列信息和流行病学监测数据,实现了对 SARS-CoV-2 变异株流行趋势的前瞻性预测,且具备时空精度和单残基突变扫描能力。

在这项最新研究中,研究团队开发了 DeepCoV(DMS-Empowered Evolution Prediction of CoronaVirus),这是一个深度学习框架,用于动态识别具有高流行潜力且在时空分辨率上具备优势的新兴变异株。
该框架整合了深度突变扫描(DMS)来源的突变表型、进化序列数据以及反映人类免疫压力的流行病学监测数据。与基于逻辑回归的方法以及具有代表性的深度学习方法在模拟回顾性监测场景中的性能对比显示,DeepCoV 能够提前一个月准确预测近期流行谱系的优势地位,误报率降低 90%,同时捕捉变异株传播的时间和地理动态,并重构其区域流行轨迹。

DeepCoV 模型架构与预测应用概述
该框架还通过计算机模拟识别出 Omicron 来源骨架的突变热点,揭示了趋同进化趋势。这为及时识别免疫逃逸变异株和关键基因突变提供了一个可扩展的框架,并提供了可操作的见解。
论文链接:
https://www.nature.com/articles/s41564-026-02378-4
原标题:《Nature子刊:曹云龙团队利用蛋白质语言模型预测SARS-CoV-2的时空分辨率进化动态》

