人工智能ChatGPT和Flan-PaLM双双通过美国医生许可考试(USMLE)

2023-01-25 MedSci原创 MedSci原创 发表于上海

根据最近的两篇论文,两个人工智能 (AI) 程序——包括 ChatGPT——已经通过了美国医学许可考试 (USMLE)。

根据最近的两篇论文,两个人工智能 (AI) 程序——包括 ChatGPT——已经通过了美国医学许可考试 (USMLE)。

这些论文重点介绍了使用大型语言模型参加 USMLE 的不同方法,该考试由三门考试组成:Step 1、Step 2 CK 和 Step 3。

ChatGPT是一种人工智能 (AI) 搜索工具,它根据人类用户的提示模仿长篇写作。 它由 OpenAI 开发,并在几篇社交媒体帖子显示该工具在临床实践中的潜在用途后变得流行,通常结果喜忧参半。

第一篇论文于 12 月在 medRxiv上发表,调查了 ChatGPT 在考试前没有任何特殊培训或强化的情况下在 USMLE 上的表现。 根据加利福尼亚州山景城 Ansible Health 的医学博士 Victor Tseng 及其同事的说法,结果显示“新的和令人惊讶的证据”表明这种人工智能工具能够应对挑战。

Tseng 和团队指出,ChatGPT 在所有测试中的准确率都超过 50%,甚至在他们的大部分分析中都达到了 60%。 虽然 USMLE 通过阈值确实因年份而异,但作者表示大多数年份的通过率约为 60%。

“ChatGPT 在没有任何专门培训或强化的情况下,在所有三项考试中的表现都达到或接近通过门槛,”他们写道,并指出该工具能够证明“其解释具有高度的一致性和洞察力”。

“这些结果表明,大型语言模型可能有助于医学教育,并可能有助于临床决策,”他们总结道。

 

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (2)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2124697, encodeId=1098212469e2f, content=<a href='/topic/show?id=5148105825a4' target=_blank style='color:#2F92EE;'>#AI代替医生#</a>指日可待的, beContent=null, objectType=article, channel=null, level=null, likeNumber=45, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=105825, encryptionId=5148105825a4, topicName=AI代替医生)], attachment=null, authenticateStatus=null, createdAvatar=https://img.medsci.cn/Random/55971dc507c93968175ce7cc1e177b372a83869f.jpg, createdBy=f63e4754896, createdName=侠胆医心, createdTime=Mon Apr 10 01:21:24 CST 2023, time=2023-04-10, status=1, ipAttribution=上海), GetPortalCommentsPageByObjectIdResponse(id=2111369, encodeId=833c2111369a7, content=<a href='/topic/show?id=d3a024808e0' target=_blank style='color:#2F92EE;'>#人工智能#</a><a href='/topic/show?id=c751105068f0' target=_blank style='color:#2F92EE;'>#chatGPT#</a>和<a href='/topic/show?id=1e6b10512813' target=_blank style='color:#2F92EE;'>#Flan-PaLM#</a>双双通过<a href='/topic/show?id=65ee105129ee' target=_blank style='color:#2F92EE;'>#美国医生许可考试#</a>(<a href='/topic/show?id=9a2e105130d1' target=_blank style='color:#2F92EE;'>#USMLE#</a>), beContent=null, objectType=article, channel=null, level=null, likeNumber=79, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=24808, encryptionId=d3a024808e0, topicName=人工智能), TopicDto(id=105068, encryptionId=c751105068f0, topicName=chatGPT), TopicDto(id=105128, encryptionId=1e6b10512813, topicName=Flan-PaLM), TopicDto(id=105129, encryptionId=65ee105129ee, topicName=美国医生许可考试), TopicDto(id=105130, encryptionId=9a2e105130d1, topicName=USMLE)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=8f0715, createdName=showtest, createdTime=Wed Jan 25 02:08:23 CST 2023, time=2023-01-25, status=1, ipAttribution=上海)]
    2023-04-10 侠胆医心 来自上海

    #AI代替医生#指日可待的

    0

  2. [GetPortalCommentsPageByObjectIdResponse(id=2124697, encodeId=1098212469e2f, content=<a href='/topic/show?id=5148105825a4' target=_blank style='color:#2F92EE;'>#AI代替医生#</a>指日可待的, beContent=null, objectType=article, channel=null, level=null, likeNumber=45, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=105825, encryptionId=5148105825a4, topicName=AI代替医生)], attachment=null, authenticateStatus=null, createdAvatar=https://img.medsci.cn/Random/55971dc507c93968175ce7cc1e177b372a83869f.jpg, createdBy=f63e4754896, createdName=侠胆医心, createdTime=Mon Apr 10 01:21:24 CST 2023, time=2023-04-10, status=1, ipAttribution=上海), GetPortalCommentsPageByObjectIdResponse(id=2111369, encodeId=833c2111369a7, content=<a href='/topic/show?id=d3a024808e0' target=_blank style='color:#2F92EE;'>#人工智能#</a><a href='/topic/show?id=c751105068f0' target=_blank style='color:#2F92EE;'>#chatGPT#</a>和<a href='/topic/show?id=1e6b10512813' target=_blank style='color:#2F92EE;'>#Flan-PaLM#</a>双双通过<a href='/topic/show?id=65ee105129ee' target=_blank style='color:#2F92EE;'>#美国医生许可考试#</a>(<a href='/topic/show?id=9a2e105130d1' target=_blank style='color:#2F92EE;'>#USMLE#</a>), beContent=null, objectType=article, channel=null, level=null, likeNumber=79, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=24808, encryptionId=d3a024808e0, topicName=人工智能), TopicDto(id=105068, encryptionId=c751105068f0, topicName=chatGPT), TopicDto(id=105128, encryptionId=1e6b10512813, topicName=Flan-PaLM), TopicDto(id=105129, encryptionId=65ee105129ee, topicName=美国医生许可考试), TopicDto(id=105130, encryptionId=9a2e105130d1, topicName=USMLE)], attachment=null, authenticateStatus=null, createdAvatar=, createdBy=8f0715, createdName=showtest, createdTime=Wed Jan 25 02:08:23 CST 2023, time=2023-01-25, status=1, ipAttribution=上海)]

相关资讯

无需烦恼试管婴儿选择哪个胚胎移植,可交给人工智能来打分!

辅助孵化能够改善自发塌陷囊胚的着床潜能[6],或许未来能够在AI评分的基础上“挽救”这些发生了自发塌陷的“差生”。

Rheumatology:骨关节炎中的人工智能,膝关节牵张修复显示疼痛、放射学和免疫结果的相关性

膝关节牵张(KJD)与临床和结构改善以及滑液(SF)标志物改变相关。本研究旨在使用基于人工智能的自动测量方法分析KJD后的X线变化,并将这些变化与临床结果和SF标记物联系起来。

Radiology:人工智能在预测胰腺癌CT淋巴结转移方面的价值

最近,人们对应用深度学习进行癌症成像数据的LN转移预测越来越感兴趣。

综述丨肺亚实性结节的个性化管理研究进展

肺亚实性结节的个性化管理研究进展

Radiology:腹部CT可以预测10年内发生不良临床事件的几率?快来看看吧!

随着技术的发展,基于人工智能(AI)的全自动工具可以用来得出这些基于CT的标志物。

European Radiology:全自动评分软件对不同层厚低剂量胸部CT Agatston钙化评分的评价

最近,使用非心电图门控的低剂量胸部CT(LDCT)成功的进行了冠状动脉钙化的评估,且与CSCT有很好的相关性。