HISTOPATHOLOGY:ChatGPT和组织病理学家在病理诊断和协作潜力方面的比较分析

2023-12-11 Jenny Ou MedSci原创 发表于上海

ChatGPT4作为组织病理学诊断工具的使用因其固有的缺点而受到限制。对ChatGPT4生成的信息和组织病理学诊断进行明智的评估至关重要,不能取代病理学家的敏锐度和判断力。

ChatGPT于2022年11月推出,是由OpenAI研究实验室开发的人工智能(AI)聊天机器人。它使用强大的语言模型Geneserative Pretrained Transformer(GPT)来促进自然语言的推理和组成。ChatGPT在医疗保健中的早期适应已经证明了其潜力,从通过转录临床笔记到作为虚拟助理来改善医患对话中的同理心,以及作为诊断任务和治疗决策的高级直观的临床决策支持系统(CDSS)。

ChatGPT因其在各种标准化医疗检查中的表现而引起了主流媒体和医学界的极大关注。例如,最近的一项研究报告称,ChatGPT能够在几个知识领域提供事实准确和上下文相关的答案,并在虚拟专家妇产科客观结构化临床检查(OSCE)中优于人类候选人。然而,ChatGPT在严重依赖视觉解释的组织病理学领域的表现如何仍然未知。

此前,已经描述了ChatGPT在病理学医学教育中的应用,这表明它有能力解决更高阶推理问题。然而,尚未进行评估ChatGPT作为解决常规组织病理学报告期间遇到的常见诊断挑战或其在复杂病例中作为CDSS潜力的一般参考的实用性。ChatGPT的表现在多大程度上与病理学家的评估一致也仍然未知。

2023年11月30日发表在HISTOPATHOLOGY的文章,旨在衡量ChatGPT在诊断组织病理学中的表现,并评估病理学家和ChatGPT之间的合作潜力,以提供更准确的诊断。

在研究的第一部分中,病理学家和ChatGPT面临了一系列问题,包括组织病理学中常见的诊断难题。对于第二部分,病理学家回顾了一系列具有挑战性的虚拟幻灯片,并在咨询ChatGPT之前和之后提供了诊断。

研究结果显示,ChatGPT在获得正确诊断方面的表现不如病理学家。与ChatGPT的咨询提供了有限的帮助,ChatGPT生成的信息取决于病理学家提供的提示,并不总是正确的。最后,本文调查了对ChatGPT诊断准确性评价很差的病理学家,但发现它作为高级搜索引擎很有用。

测试后调查的结果评估了病理学家在组织病理学中对ChatGPT的看法和情绪

综上所述,本文对ChatGPT在常规组织病理学实践中的效用进行了首次广泛调查。这项研究引起了人们对将ChatGPT纳入日常组织病理学实践的担忧,因为我们强调了ChatGPT在常规组织病理学诊断中犯的错误,类似于它可能如何获得医学问题“惊人错误”。ChatGPT也可能使用错误的推理来得出正确答案。ChatGPT被描述为“知道很多,但危险在于它在很大一部分时间里是自信和错误的”。此外,ChatGPT缺乏对数学知识的真正理解。

由于无法执行数学任务,并且作为下一个令牌预测机器的功能有限,ChatGPT纯粹在语言层面上响应提示,而不是病理学家用来排除/包括鉴别诊断的统计/贝叶斯模型。它只生成下一个单词,并且没有修改或修改其先前输出的机制,从而导致线性论证方法。此外,在本研究中,重新生成相同问题的提示导致了ChatGPT的不同答案。这引起了人们对所提供信息的可重复性和一致性的担忧。例如,当提出相同的问题或答案再生时,会给出“径向疤痕”和“管状腺瘤”等答案,而不是“硬化性腺病”。

参与者之间的共识表明,ChatGPT可能会被假阴性和假阳性结果所误导,例如异常的免疫组织化学染色或误导性的临床情景。受访者强调了审查和验证ChatGPT提供的信息的重要性,而不是盲目接受它。一篇社论甚至指出,ChatGPT“不能被信任来获取事实或产生可靠的参考”。

此外,ChatGPT虚构和参与“幻觉”的趋势是众所周知的。通过ChatGPT生成虚假引用列表是可能的,因为它的基础设施不会将事实与虚构分开,并根据其训练集中统计学上最可能的下一个最佳词产生产出。当信息不存在时,ChatGPT试图使用其掌握的数据产生答案的最高持续概率,该可能是错误的/虚构的。

原始出处

Oon, M.L., Syn, N.L., Tan, C.L., Tan, K.-B. and Ng, S.-B. (2023), Bridging bytes and biopsies: A comparative analysis of ChatGPT and histopathologists in pathology diagnosis and collaborative potential. Histopathology. https://doi.org/10.1111/his.15100

相关资料下载:
[AttachmentFileName(sort=1, fileName=Histopathology - 2023 - Oon - Bridging bytes and biopsies A comparative analysis of ChatGPT and histopathologists in.pdf)] GetArticleByIdResponse(id=b884804554e2, projectId=1, sourceId=null, title=HISTOPATHOLOGY:ChatGPT和组织病理学家在病理诊断和协作潜力方面的比较分析, articleFrom=MedSci原创, journalId=2733, copyright=原创, creationTypeList=[1], summary=ChatGPT4作为组织病理学诊断工具的使用因其固有的缺点而受到限制。对ChatGPT4生成的信息和组织病理学诊断进行明智的评估至关重要,不能取代病理学家的敏锐度和判断力。, cover=https://img.medsci.cn/20230504/1683218921152_4754896.png, authorId=0, author=Jenny Ou, originalUrl=, linkOutUrl=, content=<p><span style="color: #595959; font-size: 14px;"><span style="color: #3573b9;">ChatGPT</span>于2022年11月推出,是由OpenAI研究实验室开发的<span style="color: #3573b9;">人工智能(AI)</span>聊天机器人。它使用强大的语言模型Geneserative Pretrained Transformer(GPT)来促进自然语言的推理和组成。ChatGPT在医疗保健中的早期适应已经证明了其潜力,从通过转录临床笔记到作为虚拟助理来改善医患对话中的同理心,以及作为诊断任务和治疗决策的高级直观的临床决策支持系统(CDSS)。</span></p> <p><span style="color: #595959; font-size: 14px;">ChatGPT因其在各种标准化医疗检查中的表现而引起了主流媒体和医学界的极大关注。例如,最近的一项研究报告称,ChatGPT能够在几个知识领域提供事实准确和上下文相关的答案,并在虚拟专家妇产科客观结构化临床检查(OSCE)中优于人类候选人。然而,ChatGPT在严重依赖视觉解释的组织病理学领域的表现如何仍然未知。</span></p> <p><span style="color: #595959; font-size: 14px;">此前,已经描述了ChatGPT在病理学医学教育中的应用,这表明它有能力解决更高阶推理问题。然而,尚未进行评估ChatGPT作为解决常规组织病理学报告期间遇到的常见诊断挑战或其在复杂病例中作为CDSS潜力的一般参考的实用性。ChatGPT的表现在多大程度上与病理学家的评估一致也仍然未知。</span></p> <p><span style="color: #595959; font-size: 14px;"><img class="wscnph" style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/20231210/1702244557821_8624070.png" /></span></p> <p><span style="color: #595959; font-size: 14px;"><strong><span style="color: #3573b9;">2023年11月30日</span></strong>发表在<em><strong><span style="color: #3573b9;">HISTOPATHOLOGY</span></strong></em>的文章,旨在衡量ChatGPT在诊断组织病理学中的表现,并评估病理学家和ChatGPT之间的合作潜力,以提供更准确的诊断。</span></p> <p><span style="color: #595959; font-size: 14px;">在研究的第一部分中,病理学家和ChatGPT面临了一系列问题,包括组织病理学中常见的诊断难题。对于第二部分,病理学家回顾了一系列具有挑战性的虚拟幻灯片,并在咨询ChatGPT之前和之后提供了诊断。</span></p> <p><span style="color: #595959; font-size: 14px;">研究结果显示,ChatGPT在获得正确诊断方面的表现不如病理学家。与ChatGPT的咨询提供了有限的帮助,ChatGPT生成的信息取决于病理学家提供的提示,并不总是正确的。最后,本文调查了对ChatGPT诊断准确性评价很差的病理学家,但发现它作为高级搜索引擎很有用。</span></p> <p><span style="color: #595959; font-size: 14px;"><img class="wscnph" style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/20231210/1702244635884_8624070.jpg" /></span></p> <p style="text-align: center;"><span style="color: #888888; font-size: 12px;">测试后调查的结果评估了病理学家在组织病理学中对ChatGPT的看法和情绪</span></p> <p><span style="color: #595959; font-size: 14px;">综上所述,本文对ChatGPT在常规组织病理学实践中的效用进行了首次广泛调查。这项研究引起了人们对将ChatGPT纳入日常组织病理学实践的担忧,因为我们强调了ChatGPT在常规组织病理学诊断中犯的错误,类似于它可能如何获得医学问题&ldquo;惊人错误&rdquo;。ChatGPT也可能使用错误的推理来得出正确答案。ChatGPT被描述为&ldquo;知道很多,但危险在于它在很大一部分时间里是自信和错误的&rdquo;。此外,ChatGPT缺乏对数学知识的真正理解。</span></p> <p><span style="color: #595959; font-size: 14px;">由于无法执行数学任务,并且作为下一个令牌预测机器的功能有限,ChatGPT纯粹在语言层面上响应提示,而不是病理学家用来排除/包括鉴别诊断的统计/贝叶斯模型。它只生成下一个单词,并且没有修改或修改其先前输出的机制,从而导致线性论证方法。此外,在本研究中,重新生成相同问题的提示导致了ChatGPT的不同答案。这引起了人们对所提供信息的可重复性和一致性的担忧。例如,当提出相同的问题或答案再生时,会给出&ldquo;径向疤痕&rdquo;和&ldquo;管状腺瘤&rdquo;等答案,而不是&ldquo;硬化性腺病&rdquo;。</span></p> <p><span style="color: #595959; font-size: 14px;">参与者之间的共识表明,ChatGPT可能会被假阴性和假阳性结果所误导,例如异常的免疫组织化学染色或误导性的临床情景。受访者强调了审查和验证ChatGPT提供的信息的重要性,而不是盲目接受它。一篇社论甚至指出,ChatGPT&ldquo;不能被信任来获取事实或产生可靠的参考&rdquo;。</span></p> <p><span style="color: #595959; font-size: 14px;">此外,ChatGPT虚构和参与&ldquo;幻觉&rdquo;的趋势是众所周知的。通过ChatGPT生成虚假引用列表是可能的,因为它的基础设施不会将事实与虚构分开,并根据其训练集中统计学上最可能的下一个最佳词产生产出。当信息不存在时,ChatGPT试图使用其掌握的数据产生答案的最高持续概率,该可能是错误的/虚构的。</span></p> <p><span style="color: #888888; font-size: 12px;">原始出处</span></p> <p><span style="color: #888888; font-size: 12px;">Oon, M.L., Syn, N.L., Tan, C.L., Tan, K.-B. and Ng, S.-B. (2023), Bridging bytes and biopsies: A comparative analysis of ChatGPT and histopathologists in pathology diagnosis and collaborative potential. Histopathology. <span aria-label="Digital Object Identifier">https://doi.org/10.1111/his.15100</span></span></p> <p><!-- notionvc: ddc3fa17-dd71-492a-9a8f-4bd5a64cedf7 --></p>, belongTo=, tagList=[TagDto(tagId=467561, tagName=chatGPT), TagDto(tagId=484262, tagName=组织病理学家)], categoryList=[CategoryDto(categoryId=68, categoryName=智慧医疗, tenant=100), CategoryDto(categoryId=69, categoryName=检验病理, tenant=100), CategoryDto(categoryId=84, categoryName=研究进展, tenant=100), CategoryDto(categoryId=20656, categoryName=梅斯医学, tenant=100)], articleKeywordId=0, articleKeyword=, articleKeywordNum=6, guiderKeywordId=0, guiderKeyword=, guiderKeywordNum=6, opened=1, paymentType=1, paymentAmount=0, recommend=0, recommendEndTime=null, sticky=0, stickyEndTime=null, allHits=9375, appHits=11, showAppHits=0, pcHits=52, showPcHits=9364, likes=0, shares=2, comments=0, approvalStatus=1, publishedTime=Mon Dec 11 13:43:00 CST 2023, publishedTimeString=2023-12-11, pcVisible=1, appVisible=1, editorId=6556185, editor=检验病理新前沿, waterMark=0, formatted=0, deleted=0, version=4, createdBy=dac48624070, createdName=JennyOu, createdTime=Mon Dec 11 05:46:36 CST 2023, updatedBy=92910, updatedName=rayms, updatedTime=Sat Jan 06 04:13:38 CST 2024, ipAttribution=上海, attachmentFileNameList=[AttachmentFileName(sort=1, fileName=Histopathology - 2023 - Oon - Bridging bytes and biopsies A comparative analysis of ChatGPT and histopathologists in.pdf)])
Histopathology - 2023 - Oon - Bridging bytes and biopsies A comparative analysis of ChatGPT and histopathologists in.pdf
版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2174204, encodeId=02eb21e42045a, content=<a href='/topic/show?id=c751105068f0' target=_blank style='color:#2F92EE;'>#chatGPT#</a> <a href='/topic/show?id=9e1c1084e248' target=_blank style='color:#2F92EE;'>#组织病理学家#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=32, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=105068, encryptionId=c751105068f0, topicName=chatGPT), TopicDto(id=108472, encryptionId=9e1c1084e248, topicName=组织病理学家)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cade5395722, createdName=梅斯管理员, createdTime=Mon Dec 11 09:45:17 CST 2023, time=2023-12-11, status=1, ipAttribution=上海)]

相关资讯

AMERICAN JOURNAL OF CLINICAL PATHOLOGY:评估ChatGPT病理学知识

如果接受更大、专业的医疗数据集的培训,ChatGPT有可能成为病理学教育的宝贵资源。那些仅仅为了病理学培训而依赖它(以目前的形式)的人应该谨慎行事。

Gastroenterology:ChatGPT回答关于结肠镜检查的常见问题

这项研究首次证明了当代对话式人工智能程序能够为胃肠病学家确定的有关结肠镜检查的CQs提供易于理解、科学充分且总体令人满意的答案。

arxiv:大模型也有人格,MBTI测试来了!原来GPT-4是i型人格!

简直了,有人居然给大模型测了一波MBTI。

chatGPT成功进行疑难病例诊断:1例严重低血糖患者

这是发表在NEJM 2022年的一个病例(这个病例是chatGPT不可能学习过的,因为chatGPT还是2021年10月份以前的知识),下面测试chatGPT对疑难病例诊断的效果:

Nature:谷歌推出医学版ChatGPT——Med-PaLM 2

2022年底,OpenAI推出的基于大语言模型(Large language model,LLM)的聊天机器人ChatGPT展示了令人印象深刻的强大能力,但大语言模型在临床应用的门槛很高。医学是一项人

ASJ:人工智能和大型语言模型的医学应用

人工智能在医学领域应用的假设需要被验证。