扩大检测范围后需警惕假阳性问题

于同奎
2020-04-08 20:06
来源:澎湃新闻

在全国上下的严格防控措施下,新冠肺炎疫情得到初步控制。为防止疫情再次暴发,无症状感染者及其传播风险越来越受到重视。国家卫健委从4月1日起将无症状感染者列入疫情通报内容,采取加大筛查力度、扩大检测范围等措施加强管理。

而扩大检测范围之后,检测结果出现假阳性的概率将会随之增加,需要得到重视。本文通过一个例子介绍在大范围检测下阳性检测结果失真的现象。

假设社会中有一万个人,其中被感染的概率为万分之一,即大约有一个人被感染。检测技术很准确但也有很小的误差,大约为万分之一,即一万次检测中可能出错一次。由于无症状感染的存在,需要对这一万人全覆盖检测。那么,当检测完成后,检测出来的阳性样本大约有几个呢?

对于那位真正的感染者,被检测出来阳性的概率很高,万分之九千九百九十九。而对于其他9999个非感染者,虽然每个人被检测为阳性的概率很低,但是,由于检测范围太大,大约会有一位“倒霉”的非感染者因为那万分之一的误差被检测为阳性(即假阳性)。所以,总共会有大约两个人的检测结果为阳性,包括那一位真正的感染者和一位被误测的非感染者。

而我们无法区分哪位是真正的感染者和哪位是被误测的非感染者。那么,如果一个人被检测出来为阳性,他真正感染的概率为多少呢?由于总共大约有两个阳性检测结果,他要么是那个真正感染者,要么是那个被误测的非感染者。所以,对于一个阳性检测结果,我们只有二分之一的把握他是一个真正的感染者,虽然检测误差率仅为万分之一。

可见,造成阳性检测结果失真的原因有两个:一个是真正感染者在人群中的比例较低,他们通常会被检测为阳性,但数量较少;二是检测范围过大,虽然检测误差率很低,但是检测的人数太多总有少数人的被误测为阳性。所以,被误测为阳性的样本占总的阳性样本的比例就会比较高,造成结果失真。

上述分析对无症状感染者防控可以提供如下启示:

1.对于无症状感染者的检测范围不能过宽,因为检测范围越广,阳性结果失真程度越大。现在国家卫健委的指导意见为“将检测范围扩大至已发现病例和无症状感染者的密切接触者、重点地区和重点人群等”是很合适的。

2.在扩大检测范围后,应充分重视“假阳性”的客观存在性。建议不直接把一次阳性结果作为无症状感染者的依据,而是在重复检测为阳性后才确认为无症状感染者。

3.从严格防控的角度来讲,可以对一次阳性结果的人采取隔离措施。但是,对这类人一定要作为疑似病例来进行隔离,即单人单间隔离,避免交叉感染。

本文所用的方法,在概率论中被称为贝叶斯分析。感兴趣的读者,不妨参阅盛骤、谢式千、潘承毅编著的《概率论与数理统计(第4版)》(高等教育出版社,2008),获取更多信息。当然,要是您还嫌这本“概率论与数理统计”太过专业的话,建议读读日本作家小岛宽之博士所著的《统计学关我什么事——生活中的极简统计学》(北京时代华文书局,2018)。

疫情防控是一个涉及众多学科的系统工程,需要综合考虑各种因素。本文仅仅从概率分析的角度,对在扩大范围检测后会造成阳性结果失真的现象提出提醒。

(作者于同奎为西南大学计算机与信息科学学院副教授)

    责任编辑:蔡军剑
    校对:刘威