专家临床医生与人工智能在罕见病诊断中的正面比较
2025-12-12 田医生 MedSci原创 发表于上海
此次研究为AI在罕见病领域的应用提供了现实检验,强调“人机协同”而非“机器替代”的发展方向,对推动智能诊断工具的临床整合具有重要参考价值。
目前罕见病种类超过6000种,患者平均需经历约5年才能获得准确诊断。为缩短诊断延迟,德国已设立30余个大学附属罕见病中心,并通过多学科病例讨论会(interdisciplinary case conferences)整合不同专科专家意见以提升诊断效率。
与此同时,AI驱动的诊断辅助工具如“Isabel Healthcare”也被开发用于支持临床决策。该工具最初为儿科急症设计,后扩展至成人疾病,能基于症状、体征及实验室指标生成分级诊断建议(“更可能”、“可能”、“不太可能”)。
国外研究团队评估了人工智能辅助诊断工具“Isabel Healthcare DDx Companion”在罕见病诊断中与多学科专家团队的诊断能力对比。研究采用前瞻性、单中心观察设计,在德国波恩大学医院罕见病中心开展,共纳入100名疑似罕见病但尚未确诊的成年患者(年龄18–64岁),所有患者均提供书面知情同意。
研究方法上,每位患者的完整病史(包括症状、体征、既往病史、用药、实验室结果等)被同步提供给多学科专家会议和“Isabel Healthcare”系统。专家会议独立形成疑似诊断、鉴别诊断及进一步检查建议;而AI工具则在会议结束后独立运行,其结果不参与实际诊疗决策。研究重点比较两者在前10项诊断建议中的重合度,并分析不同置信等级(如“更可能”)下的匹配情况。
研究结果显示,100例患者共产生727个独特诊断建议(其中专家提出253个疑似诊断和129项检查建议,AI提出4016条诊断建议)。在AI生成的前10项建议中,仅有28%的患者至少有一项诊断与专家会议结论一致;66%的患者完全无匹配。若仅看“更可能”类别(共432条建议),有25条与专家诊断重合;“可能”类别(484条)中仅13条匹配;“不太可能”类别(84条)中仅2条匹配。这表明AI高置信度建议与专家判断的一致性更高。
尽管AI工具在部分案例中能提供有价值的鉴别诊断线索,但其整体独立诊断能力有限,尤其在面对未经临床过滤的原始复杂病史时表现不佳。作者指出,AI的有效性高度依赖输入信息的质量和相关性,缺乏临床语境可能导致误判或过度泛化。此外,回顾性研究常因使用预筛选数据而高估AI性能,而本研究的前瞻性设计更贴近真实临床场景。
“Isabel Healthcare”可作为临床医生的辅助工具,帮助拓宽鉴别诊断范围、减少遗漏,但不能替代专家综合判断。未来AI系统需结合结构化表型输入、动态知识库及临床反馈机制,才能在罕见病诊断中发挥更大作用。研究也承认局限性,如未追踪最终确诊结果(以专家会议结论为“金标准”)、样本量有限等。
此次研究为AI在罕见病领域的应用提供了现实检验,强调“人机协同”而非“机器替代”的发展方向,对推动智能诊断工具的临床整合具有重要参考价值。
参考文献:
Georg Wolfgang, Sendtner,Martin, Muecke,Lorenz, Grigull et al. Cracking the code: a head-to-head comparison of expert clinicians and artificial intelligence in diagnosing rare diseases.[J] .Orphanet J Rare Dis, 2025, 20: 564.
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言









#人工智能# #罕见病诊断#
27 举报