哈佛研究:AI急诊分诊诊断准确率超越人类医生

2026-05-07 11:30
北京

从《急诊室的春天》中的乔治·克鲁尼,到《深渊》中的诺亚·怀利,急诊科医生长期以来都是荧幕上的英雄形象。但这一局面是否即将迎来改变?

一项来自哈佛大学的突破性研究发现,在高压力的急诊医学分诊场景中,AI系统的表现超越了人类医生——在患者被紧急送医的关键时刻,AI的诊断准确率更高,而这些时刻往往事关生死。

独立专家将这一结果评价为AI临床推理能力的"真正进步"。该研究对数百名医生与AI的反应进行了对比测试。

研究作者表示,相关成果已发表于《科学》期刊,结果显示大语言模型"在大多数临床推理基准测试中已超越人类"。

其中一项实验聚焦于抵达波士顿某医院急诊室的76名患者。AI与两名人类医生获得了相同的标准电子健康档案,通常包括生命体征数据、人口统计信息,以及护士关于患者就诊原因的简短描述。AI在67%的案例中做出了精确或接近正确的诊断,优于人类医生50%至55%的准确率。

研究表明,AI的优势在需要以极少信息快速做出决策的分诊场景中尤为突出。当可用信息增加时,该AI(OpenAI的o1推理模型)的诊断准确率上升至82%,而专家级人类医生的准确率为70%至79%,不过这一差异在统计学上并不显著。

在制定长期治疗方案方面,如抗生素用药方案或临终关怀计划,AI同样优于更大规模的人类医生群体。研究人员让AI与46名医生共同分析5个临床案例,AI制定的方案明显更优,得分高达89%,而人类医生借助搜索引擎等常规工具的得分仅为34%。

不过,研究人员表示,这并不意味着急诊医生即将被取代。本研究仅测试了AI与人类处理可通过文字传达的患者数据的能力,AI对患者痛苦程度、外观状态等视觉信号的识别能力并未纳入测试范围。这意味着AI目前更像是一名基于书面资料提供第二意见的临床辅助工具。

"我认为研究结果并不意味着AI会取代医生,"研究主要作者之一、哈佛医学院AI实验室负责人阿尔琼·曼拉伊表示,"但我认为这意味着我们正在见证一场深刻的技术变革,它将重塑整个医学领域。"

另一位主要作者、研究发生地波士顿贝斯以色列女执事医疗中心的医生亚当·罗德曼博士表示,大语言模型是"数十年来最具影响力的技术之一"。他预计,未来十年内AI不会取代医生,而是将加入医疗实践,形成全新的"三元照护模式——医生、患者与AI系统共同协作"。

哈佛研究中有一个典型案例:一名患者出现肺部血栓并伴有症状恶化,人类医生认为是抗凝药物失效,但AI注意到了人类忽略的细节——患者有狼疮病史,这可能正是引发肺部炎症的原因。事实证明,AI的判断是正确的。

根据上月发布的研究数据,美国近五分之一的医生已在使用AI辅助诊断。英国皇家内科医学院最新调查显示,英国有16%的医生每天使用AI,另有15%每周使用,"临床决策"是最常见的应用场景之一。

英国医生最担忧的是AI出错及由此带来的责任风险。尽管数十亿资金正涌入AI医疗健康公司,AI出错的后果问题仍悬而未决。

"目前还没有正式的问责框架,"罗德曼表示。他同时强调,患者终究"希望由人类来引导他们面对生死抉择和复杂的治疗方案"。

爱丁堡大学医学信息学中心联合主任尤恩·哈里森教授认为,这项研究意义重大,表明"这些系统已不再仅仅是通过医学考试或解答人工测试题,而是开始成为临床医生实用的第二意见工具,尤其是在需要考量更广泛鉴别诊断、避免漏诊的场合"。

谢菲尔德大学数学与物理科学学院助理教授魏星则指出,部分研究结果表明,医生可能会在无意间倾向于采纳AI的答案,而非独立思考。

"随着AI在临床环境中的应用日益普及,这种倾向可能会愈发明显,"他说。他还指出,研究缺乏关于AI在哪类患者中表现较差的信息,例如AI是否在老年患者或非英语使用者的诊断上存在更大困难。

他表示:"这项研究并不能证明AI已可安全用于常规临床实践,公众也不应将可自由获取的AI工具作为医疗建议的替代品。"

Q&A

Q1:哈佛AI诊断研究的结果是什么?

A:哈佛大学发表于《科学》期刊的研究显示,在急诊分诊场景中,AI(OpenAI o1推理模型)的诊断准确率达到67%,高于人类医生的50%至55%。当可用信息更充分时,AI准确率可升至82%。在制定长期治疗方案方面,AI得分高达89%,远超人类医生的34%。

Q2:AI会取代急诊科医生吗?

A:研究人员认为目前不会。本次研究仅测试了基于文字数据的诊断能力,AI无法感知患者的视觉状态和情绪信号。研究者预测未来将形成"医生、患者与AI"三元协作的诊疗模式,AI更多扮演辅助决策的角色,而非完全替代医生。

Q3:目前医生使用AI辅助诊断的比例有多高?

A:根据近期调查数据,美国约五分之一的医生已在使用AI辅助诊断。在英国,16%的医生每天使用AI,另有15%每周使用,"临床决策"是最主要的应用场景之一。但医生们对AI出错及相应责任归属问题仍存在较大顾虑。

    特别声明
    本文为澎湃号作者或机构在澎湃新闻上传并发布,仅代表该作者或机构观点,不代表澎湃新闻的观点或立场,澎湃新闻仅提供信息发布平台。申请澎湃号请用电脑访问https://renzheng.thepaper.cn。