脸书和纽约大学联合研发AI模型，可预测新冠患者病情发展

澎湃新闻记者王心馨

2021-01-19 21:52

来源：澎湃新闻

当地时间1月15日，Facebook通过官方博客宣布，其与纽约大学（NYU）研究人员开发了三种机器学习模型，可以帮助医生预测COVID-19患者病情可能会如何发展。这些开源模型只需要一系列X光片，就可以提前预测患者至少四天后的病情恶化情况，还能预测患者可能需要补充的氧气量。

利用X光片来开发相应的AI算法，并用于诊断COVID-19病情，并不是新鲜事。此前，斯坦福大学、西奈山医院和电子病历供应商Epic和Cerner也开发过相关模型，可以得出患者死亡或需要呼吸机的风险评分。Facebook和NYU采用了不同的方法，团队建立的模型试图预测更长期的临床病情轨迹。

据介绍，该项目是Facebook与纽约大学朗格健康中心预测分析部门和放射学系合作的一部分。Facebook研究人员使用自我监督学习技术，在两个大型公共胸部X光片数据集MIMIC-CXR-JPG和CheXpert上对AI系统进行了预训练。通过自我监督学习，即使是在没有告知模型X光片上数据标签含义的情况下，这款名为MoCo的模型仍可以从数据集里的X光片学习。

研究的下一步是利用NYU公开可用的COVID-19数据集对扩展版的MoCo模型进行微调。研究人员用来自4914位患者的26838张X光片图像构建了分类器，并进行了注释，以表明患者的状况：是否在X扫描后的24、48或72小时内病情恶化了。研究人员构建了两个分类器，一个分类器利用单张X光片来预测病人恶化情况，另一个则是根据一系列X光片做判断。

研究员称，依靠模型，能提前96小时预测病人ICU需求、死亡率和不良事件发生，优于人类专家。尽管结果不一定适用于具有独特数据集的其他医院，但研究人员认为，可以根据MoCo模型以相对较少的资源（或许是单个GPU）来构建新的分类器。

“能够预测患者是否需要氧气资源也是头等大事，并且可以帮助医院决定在未来几周和几个月内如何分配氧气。随着COVID-19在全球范围内再次大规模暴发，医院在规划资源分配时需要工具来预测，并为即将到来的激增病例做好准备。” Facebook团队在博客中写道。“这些预测可以帮助医生避免将有风险的患者过早送回家，并帮助医院更好地预测对补充氧气和其他有限资源的需求。”

不过，根据多伦多大学向量学院和麻省理工学院最近的一项研究显示，用于训练诊断模型的胸部X光片数据集，包括MIMIC-CXR和CheXpert数据集，都出现了失衡情况，数据会偏向某些性别、社会经济和种族群体。尽管数据集中女性的比例略低于男性，但女性患者之间的差异水平高。在整个数据集中，白人患者占了大多数，基本占到了67.6%，是模型最喜欢的一组数据，而西班牙裔患者则是最不受青睐的数据组。

针对数据集偏见问题，Facebook和NYU的研究人员表示，他们通过对非COVID-19病人的数据进行预训练，并仔细选择每个测试样本来解决这种偏见。但是去年早些时候，美国疾病控制与预防中心建议不要使用CT扫描或X光片进行COVID-19诊断，因为即使最好的AI系统有时也无法分辨出COVID-19与常见的肺部感染（例如细菌性或病毒性肺炎）之间的区别。

要确定Facebook和NYU算法的可靠性，可能需要在患者的同意下，在全球多个多元化的卫生系统中进行全面测试。准确预测偏差会出现在哪不太可能，但通过微调模型可能有助于避免Facebook和NYU的算法陷入偏差，这也说明了算法在大规模部署之前需要审核。

责任编辑：李跃群

校对：栾梦