脸书和纽约大学联合研发AI模型,可预测新冠患者病情发展

澎湃新闻记者 王心馨
2021-01-19 21:52
来源:澎湃新闻

当地时间1月15日,Facebook通过官方博客宣布,其与纽约大学(NYU)研究人员开发了三种机器学习模型,可以帮助医生预测COVID-19患者病情可能会如何发展。这些开源模型只需要一系列X光片,就可以提前预测患者至少四天后的病情恶化情况,还能预测患者可能需要补充的氧气量。

利用X光片来开发相应的AI算法,并用于诊断COVID-19病情,并不是新鲜事。此前,斯坦福大学、西奈山医院和电子病历供应商Epic和Cerner也开发过相关模型,可以得出患者死亡或需要呼吸机的风险评分。Facebook和NYU采用了不同的方法,团队建立的模型试图预测更长期的临床病情轨迹。

据介绍,该项目是Facebook与纽约大学朗格健康中心预测分析部门和放射学系合作的一部分。Facebook研究人员使用自我监督学习技术,在两个大型公共胸部X光片数据集MIMIC-CXR-JPG和CheXpert上对AI系统进行了预训练。通过自我监督学习,即使是在没有告知模型X光片上数据标签含义的情况下,这款名为MoCo的模型仍可以从数据集里的X光片学习。

研究的下一步是利用NYU公开可用的COVID-19数据集对扩展版的MoCo模型进行微调。研究人员用来自4914位患者的26838张X光片图像构建了分类器,并进行了注释,以表明患者的状况:是否在X扫描后的24、48或72小时内病情恶化了。研究人员构建了两个分类器,一个分类器利用单张X光片来预测病人恶化情况,另一个则是根据一系列X光片做判断。

研究员称,依靠模型,能提前96小时预测病人ICU需求、死亡率和不良事件发生,优于人类专家。尽管结果不一定适用于具有独特数据集的其他医院,但研究人员认为,可以根据MoCo模型以相对较少的资源(或许是单个GPU)来构建新的分类器。

“能够预测患者是否需要氧气资源也是头等大事,并且可以帮助医院决定在未来几周和几个月内如何分配氧气。随着COVID-19在全球范围内再次大规模暴发,医院在规划资源分配时需要工具来预测,并为即将到来的激增病例做好准备。” Facebook团队在博客中写道。“这些预测可以帮助医生避免将有风险的患者过早送回家,并帮助医院更好地预测对补充氧气和其他有限资源的需求。”

不过,根据多伦多大学向量学院和麻省理工学院最近的一项研究显示,用于训练诊断模型的胸部X光片数据集,包括MIMIC-CXR和CheXpert数据集,都出现了失衡情况,数据会偏向某些性别、社会经济和种族群体。尽管数据集中女性的比例略低于男性,但女性患者之间的差异水平高。在整个数据集中,白人患者占了大多数,基本占到了67.6%,是模型最喜欢的一组数据,而西班牙裔患者则是最不受青睐的数据组。

针对数据集偏见问题,Facebook和NYU的研究人员表示,他们通过对非COVID-19病人的数据进行预训练,并仔细选择每个测试样本来解决这种偏见。但是去年早些时候,美国疾病控制与预防中心建议不要使用CT扫描或X光片进行COVID-19诊断,因为即使最好的AI系统有时也无法分辨出COVID-19与常见的肺部感染(例如细菌性或病毒性肺炎)之间的区别。

要确定Facebook和NYU算法的可靠性,可能需要在患者的同意下,在全球多个多元化的卫生系统中进行全面测试。准确预测偏差会出现在哪不太可能,但通过微调模型可能有助于避免Facebook和NYU的算法陷入偏差,这也说明了算法在大规模部署之前需要审核。

    责任编辑:李跃群
    校对:栾梦