专家临床医生与人工智能在罕见病诊断中的正面比较

2025-12-12 田医生 MedSci原创 发表于上海

此次研究为AI在罕见病领域的应用提供了现实检验,强调“人机协同”而非“机器替代”的发展方向,对推动智能诊断工具的临床整合具有重要参考价值。

目前罕见病种类超过6000种,患者平均需经历约5年才能获得准确诊断。为缩短诊断延迟,德国已设立30余个大学附属罕见病中心,并通过多学科病例讨论会(interdisciplinary case conferences)整合不同专科专家意见以提升诊断效率。

与此同时,AI驱动的诊断辅助工具如“Isabel Healthcare”也被开发用于支持临床决策。该工具最初为儿科急症设计,后扩展至成人疾病,能基于症状、体征及实验室指标生成分级诊断建议(“更可能”、“可能”、“不太可能”)。

国外研究团队评估了人工智能辅助诊断工具“Isabel Healthcare DDx Companion”在罕见病诊断中与多学科专家团队的诊断能力对比。研究采用前瞻性、单中心观察设计,在德国波恩大学医院罕见病中心开展,共纳入100名疑似罕见病但尚未确诊的成年患者(年龄18–64岁),所有患者均提供书面知情同意。

研究方法上,每位患者的完整病史(包括症状、体征、既往病史、用药、实验室结果等)被同步提供给多学科专家会议和“Isabel Healthcare”系统。专家会议独立形成疑似诊断、鉴别诊断及进一步检查建议;而AI工具则在会议结束后独立运行,其结果不参与实际诊疗决策。研究重点比较两者在前10项诊断建议中的重合度,并分析不同置信等级(如“更可能”)下的匹配情况。

研究结果显示,100例患者共产生727个独特诊断建议(其中专家提出253个疑似诊断和129项检查建议,AI提出4016条诊断建议)。在AI生成的前10项建议中,仅有28%的患者至少有一项诊断与专家会议结论一致;66%的患者完全无匹配。若仅看“更可能”类别(共432条建议),有25条与专家诊断重合;“可能”类别(484条)中仅13条匹配;“不太可能”类别(84条)中仅2条匹配。这表明AI高置信度建议与专家判断的一致性更高。

尽管AI工具在部分案例中能提供有价值的鉴别诊断线索,但其整体独立诊断能力有限,尤其在面对未经临床过滤的原始复杂病史时表现不佳。作者指出,AI的有效性高度依赖输入信息的质量和相关性,缺乏临床语境可能导致误判或过度泛化。此外,回顾性研究常因使用预筛选数据而高估AI性能,而本研究的前瞻性设计更贴近真实临床场景。

“Isabel Healthcare”可作为临床医生的辅助工具,帮助拓宽鉴别诊断范围、减少遗漏,但不能替代专家综合判断。未来AI系统需结合结构化表型输入、动态知识库及临床反馈机制,才能在罕见病诊断中发挥更大作用。研究也承认局限性,如未追踪最终确诊结果(以专家会议结论为“金标准”)、样本量有限等。

此次研究为AI在罕见病领域的应用提供了现实检验,强调“人机协同”而非“机器替代”的发展方向,对推动智能诊断工具的临床整合具有重要参考价值。

参考文献:

Georg Wolfgang, Sendtner,Martin, Muecke,Lorenz, Grigull et al. Cracking the code: a head-to-head comparison of expert clinicians and artificial intelligence in diagnosing rare diseases.[J] .Orphanet J Rare Dis, 2025, 20: 564.

评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2292953, encodeId=e3d92292953bf, content=<a href='/topic/show?id=d3a024808e0' target=_blank style='color:#2F92EE;'>#人工智能#</a> <a href='/topic/show?id=a09013155936' target=_blank style='color:#2F92EE;'>#罕见病诊断#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=27, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=24808, encryptionId=d3a024808e0, topicName=人工智能), TopicDto(id=131559, encryptionId=a09013155936, topicName=罕见病诊断)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cade5395722, createdName=梅斯管理员, createdTime=Fri Dec 12 12:10:06 CST 2025, time=2025-12-12, status=1, ipAttribution=上海)]
    2025-12-12 梅斯管理员 来自上海

相关资讯

Lancet子刊:当CT/MRI影像被AI“翻译”成病理报告,肝癌术前评估进入生成式智能时代

HepaPathGPT代表了人工智能在医学影像解读领域一次范式转变的开端——从辅助检测识别,走向跨模态的深度理解与生成。

Journal of Hepatology:肝病学中人工智能应用的障碍及克服策略

本文提出了推动人工智能在肝病学中临床转化的核心路径。

对话大咖 | 顾晋教授:AI时代,外科医生的“驭智”与“育人”

在第十届国家癌症中心结直肠癌学术会议上,【医悦汇】有幸邀请到北京大学首钢医院顾晋教授做客对话大咖栏目,探讨AI在外科领域的价值,以及外科医生该如何“驾驭”智能,坚守医学的人文本质。

【协和医学杂志】人工智能在药物不良反应监测中的作用: 现状与挑战

本文系统回顾了AI在ADR监测领域应用的关键方法,分析了结构化数据、EHR、社交媒体等不同数据源的应用场景与优势,同时指出当前该领域在数据质量、模型可解释性等方面面临的挑战。

eBioMedicine:大型语言模型在十种语言和4917例罕见病诊断中的一致性表现

尽管LLM以英语数据为主,其在多语言罕见病鉴别诊断中表现稳健,为非英语地区、尤其是资源匮乏国家部署AI辅助诊断系统提供了积极依据。

专家论坛|李君:人工智能在肝衰竭预警及预后体系中的应用与挑战

本文将系统综述基于AI的肝衰竭预警及预后研究进展,以期为优化肝衰竭的诊治模式提供参考。 

专家论坛|孔媛媛 :人工智能相关肝病临床试验的方法学考量

本文将聚焦于肝病领域的相关应用场景,从方法学角度系统梳理AI在肝病临床试验中的应用现状和主要挑战,并结合国际主流AI方法学和医学研究报告规范,探讨相应的解决策略。