Adv Sci:基于自监督学习的结直肠癌CT影像基础模型,突破标注瓶颈并领跑 TNM 分期、分子分型及预后预测

2025-08-26 吾乃喵大人 MedSci原创 发表于上海

CRCFound基于自监督学习构建,可有效缓解结直肠癌CT影像标注不足问题,展现出优异的诊断与预后预测性能,助力临床个性化治疗。

结直肠癌(CRC)是全球范围内最常见的消化道恶性肿瘤之一,五年生存率仅约65%。精准的风险分层对于制定个性化治疗方案至关重要。传统的TNM分期体系作为术后病理的金标准,尚不足以完全反映肿瘤的异质性,分子分型(如CMS分型)和微卫星不稳定性(MSI)标志物为精准治疗提供了新的视角。然而,这些分子标志物检测往往依赖昂贵且复杂的分子检测技术,且多基于术后样本,限制了其在术前风险评估中的应用。

CT作为结直肠癌术前评估的关键影像技术,能提供丰富的肿瘤形态学和浸润范围信息,近年来,伴随计算机视觉技术的飞速发展,基于CT的放射组学研究在结直肠癌诊断和预后预测中取得一定进展。但高质量标注数据的缺乏成为制约模型性能和泛化能力的重要瓶颈。 自监督学习(SSL)作为一种无需大量标注数据的深度学习范式,通过利用数据内在结构进行特征学习,近年来在自然语言处理和计算机视觉领域表现出色。医疗领域标注成本高昂,SSL为医学影像分析提供了有效解决方案,已有病理图像等领域的基础模型取得突破,但针对结直肠癌CT影像的大规模SSL基础模型尚处于起步阶段。

针对结直肠癌CT影像标注数据不足的问题,研究人员提出了CRCFound,一种基于自监督学习的结直肠癌CT影像基础模型。研究收集了6332例结直肠癌患者的三维CT图像数据,其中5137例无标注影像用于自监督预训练,剩余1195例带标注的影像用于下游任务微调和验证。自监督预训练采用基于掩码图像重建的任务(MAE),随机遮挡75%的图像块,模型学习从部分可见图像块重建完整图像,从而捕捉潜在的空间和结构信息。模型编码器采用基于Vision Transformer(ViT)结构的堆叠多头自注意力机制,具备强大的特征表达能力。 下游任务涵盖八大临床关键任务,包括TNM分期(T、N、M、整体分期)、MSI预测、CMS分型以及预后预测(整体生存期OS与无病生存期DFS)。此外,融合了中文放射学报告的文本信息,利用预训练的语言模型ChatGLM-6B提取语义特征,结合影像特征实现多模态融合,提升诊断性能。训练过程中,采用5折交叉验证保证模型稳定性,外部数据集进一步验证了模型泛化能力。

图:CRCFound 概述

主要结果

1、TNM分期诊断表现突出

模型在四个TNM分期任务中均表现出显著的优势。结合放射学报告文本信息的CRCFound_report模型在T、N、M及整体分期上的平均AUC分别达到0.889、0.847、0.830及0.774,显著优于未预训练模型。其中,N分期提升尤为明显,预训练模型相较传统模型提升幅度超过20%。Grad-CAM可视化显示,CRCFound模型能够精准聚焦肿瘤及其周围组织,表现出良好的疾病识别能力和解释性。

图:不同TNM分期中的性能比较

2、分子亚型预测能力强 在MSI预测任务中,融合文本信息的模型AUROC高达0.952,超越纯CT模型及传统训练模型约10%。CMS四分类任务中,预训练模型同样显著优于非预训练模型,尤其在CMS1亚型的识别中效果最佳,显示出模型对分子异质性的敏感性。

图:不同模型在MSI和CMS任务中的性能比较

3、预后预测显示独立预测价值 利用Cox回归模型,CRCFound在OS及DFS的风险分层中均表现出显著的统计学意义(DFS HR=4.62,OS HR=7.78,均p<0.001),且多变量分析确认CRCFound为独立预后因子,优于传统仅基于下游数据训练的模型。

图:预训练权重对CRCFound在两项预后任务中预测性能的影响

4、特征可视化揭示优秀的特征表达能力 t-SNE降维聚类分析显示,CRCFound提取的特征在多个任务中样本分类界限清晰,聚类结构明显,尤其是在样本不平衡的MSI任务中表现优异,远超未预训练模型。

图:使用与不使用CRCFound预训练权重在不同诊断任务中特征提取的聚类效果

5、多模态融合提升模型表现 融合放射学报告文本信息显著提升了模型在多个任务中的表现,尤其在TNM分期和MSI预测中尤为明显,说明影像与文本信息的互补性对精准诊断至关重要。

综上,CRCFound基于大规模无标注结直肠癌CT影像的自监督学习,成功构建了一个性能优异且泛化能力强的基础模型。该模型不仅克服了标注数据不足的瓶颈,还在多项临床关键任务中表现出色,涵盖肿瘤分期、分子分型及预后预测,展示了在结直肠癌精准诊疗中的巨大潜力。多模态融合策略进一步提升了诊断准确率,为临床决策提供了有力支持。

尽管本研究数据量较大,且包含多项任务验证,但数据主要来自单一医疗中心,未来工作需引入更多地区和多中心数据以提升模型的普适性和鲁棒性。此外,当前自监督预训练未充分利用放射学报告文本信息,未来可探索影像与文本的联合自监督训练,以挖掘更丰富的跨模态特征。结合其他影像模态(如MRI、PET)及病理图像,有望进一步提升模型对肿瘤生物学行为的理解。此外,多中心、多设备和不同扫描协议下的验证同样必要,以确保临床应用的可靠性。

原始出处

Yang J, Cai D, Liu J, et al. CRCFound: A Colorectal Cancer CT Image Foundation Model Based on Self-Supervised Learning. Adv Sci (Weinh). Published online August 12, 2025. doi:10.1002/advs.202407339

相关资料下载:
[AttachmentFileName(sort=1, fileName=Advanced Science - 2025 - Yang - CRCFound A Colorectal Cancer CT Image Foundation Model Based on Self‐Supervised Learning.pdf)] GetArticleByIdResponse(id=ee2e8936e319, projectId=1, sourceId=null, title=Adv Sci:基于自监督学习的结直肠癌CT影像基础模型,突破标注瓶颈并领跑 TNM 分期、分子分型及预后预测, articleFrom=MedSci原创, journalId=12761, copyright=原创, creationTypeList=[1], summary=CRCFound基于自监督学习构建,可有效缓解结直肠癌CT影像标注不足问题,展现出优异的诊断与预后预测性能,助力临床个性化治疗。, cover=https://img.medsci.cn/202401028/1730099897560_8538692.png, authorId=0, author=吾乃喵大人, originalUrl=, linkOutUrl=, content=<p><a href="https://www.medsci.cn/search?q=%E7%BB%93%E7%9B%B4%E8%82%A0%E7%99%8C">结直肠癌</a>(CRC)是全球范围内最常见的消化道<a href="https://www.medsci.cn/topic/show?id=3ce252932f0">恶性肿瘤</a>之一,五年生存率仅约65%。<a href="https://www.medsci.cn/search?q=%E7%B2%BE%E5%87%86">精准</a>的风险分层对于制定个性化治疗方案至关重要。传统的TNM分期体系作为术后病理的金标准,尚不足以完全反映肿瘤的异质性,分子分型(如CMS分型)和微卫星不稳定性(MSI)标志物为精准治疗提供了新的视角。然而,这些分子标志物检测往往依赖昂贵且复杂的分子检测技术,且多基于术后样本,限制了其在术前风险评估中的应用。</p> <p>CT作为结直肠癌术前评估的关键影像技术,能提供丰富的肿瘤形态学和浸润范围信息,近年来,伴随计算机视觉技术的飞速发展,基于CT的放射组学研究在结直肠癌<a href="https://www.medsci.cn/guideline/list.do?q=%E8%AF%8A%E6%96%AD">诊断</a>和预后预测中取得一定进展。但高质量标注数据的缺乏成为制约模型性能和泛化能力的重要瓶颈。 自监督学习(SSL)作为一种无需大量标注数据的深度学习范式,通过利用数据内在结构进行特征学习,近年来在自然语言处理和计算机视觉领域表现出色。医疗领域标注成本高昂,SSL为医学影像分析提供了有效解决方案,已有病理图像等领域的基础模型取得突破,但针对结直肠癌CT影像的大规模SSL基础模型尚处于起步阶段。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/20250826/1756180715935_92910.png" /></p> <p>针对结直肠癌CT影像标注数据不足的问题,研究人员提出了CRCFound,一种基于自监督学习的结直肠癌CT影像基础模型。研究收集了6332例结直肠癌患者的三维CT图像数据,其中5137例无标注影像用于自监督预训练,剩余1195例带标注的影像用于下游任务微调和验证。自监督预训练采用基于掩码图像重建的任务(MAE),随机遮挡75%的图像块,模型学习从部分可见图像块重建完整图像,从而捕捉潜在的空间和结构信息。模型编码器采用基于Vision Transformer(ViT)结构的堆叠多头自注意力机制,具备强大的特征表达能力。 下游任务涵盖八大临床关键任务,包括TNM分期(T、N、M、整体分期)、MSI预测、CMS分型以及预后预测(整体生存期OS与无病生存期DFS)。此外,融合了中文放射学报告的文本信息,利用预训练的语言模型ChatGLM-6B提取语义特征,结合影像特征实现多模态融合,提升诊断性能。训练过程中,采用5折交叉验证保证模型稳定性,外部数据集进一步验证了模型泛化能力。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/20250826/1756180796012_92910.png" /></p> <p style="text-align: center;"><span style="color: #2c2c36;">图:CRCFound 概述</span></p> <p><strong>主要结果</strong></p> <p>1、<strong>TNM分期诊断表现突出</strong></p> <p>模型在四个TNM分期任务中均表现出显著的优势。结合放射学报告文本信息的CRCFound_report模型在T、N、M及整体分期上的平均AUC分别达到0.889、0.847、0.830及0.774,显著优于未预训练模型。其中,N分期提升尤为明显,预训练模型相较传统模型提升幅度超过20%。Grad-CAM可视化显示,CRCFound模型能够精准聚焦肿瘤及其周围组织,表现出良好的疾病识别能力和解释性。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/20250826/1756181036549_92910.png" /></p> <p style="text-align: center;"><span style="color: #2c2c36;">图:不同TNM分期中的性能比较</span></p> <p>2、<strong>分子亚型预测能力强</strong> 在MSI预测任务中,融合文本信息的模型AUROC高达0.952,超越纯CT模型及传统训练模型约10%。CMS四分类任务中,预训练模型同样显著优于非预训练模型,尤其在CMS1亚型的识别中效果最佳,显示出模型对分子异质性的敏感性。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/20250826/1756181036564_92910.png" /></p> <p style="text-align: center;"><span style="color: #2c2c36;">图:不同模型在MSI和CMS任务中的性能比较</span></p> <p>3、<strong>预后预测显示独立预测价值</strong> 利用Cox回归模型,CRCFound在OS及DFS的风险分层中均表现出显著的<a href="https://www.medsci.cn/search?q=%E7%BB%9F%E8%AE%A1">统计</a>学意义(DFS HR=4.62,OS HR=7.78,均p&lt;0.001),且多变量分析确认CRCFound为独立预后因子,优于传统仅基于下游数据训练的模型。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/20250826/1756181036572_92910.png" /></p> <p style="text-align: center;"><span style="color: #2c2c36;">图:预训练权重对CRCFound在两项预后任务中预测性能的影响</span></p> <p>4、<strong>特征可视化揭示优秀的特征表达能力</strong> t-SNE降维聚类分析显示,CRCFound提取的特征在多个任务中样本分类界限清晰,聚类结构明显,尤其是在样本不平衡的MSI任务中表现优异,远超未预训练模型。</p> <p><img style="display: block; margin-left: auto; margin-right: auto;" src="https://img.medsci.cn/20250826/1756181036582_92910.png" /></p> <p style="text-align: center;">图:<span style="color: #2c2c36;">使用与不使用CRCFound预训练权重在不同诊断任务中特征提取的聚类效果</span></p> <p>5、<strong>多模态融合提升模型表现</strong> 融合放射学报告文本信息显著提升了模型在多个任务中的表现,尤其在TNM分期和MSI预测中尤为明显,说明影像与文本信息的互补性对精准诊断至关重要。</p> <p>综上,CRCFound基于大规模无标注结直肠癌CT影像的自监督学习,成功构建了一个性能优异且泛化能力强的基础模型。该模型不仅克服了标注数据不足的瓶颈,还在多项临床关键任务中表现出色,涵盖肿瘤分期、分子分型及预后预测,展示了在结直肠癌精准<a href="https://www.medsci.cn/guideline/search?keyword=%E8%AF%8A%E7%96%97">诊疗</a>中的巨大潜力。多模态融合策略进一步提升了诊断准确率,为临床决策提供了有力支持。</p> <p>尽管本研究数据量较大,且包含多项任务验证,但数据主要来自单一医疗中心,未来工作需引入更多地区和多中心数据以提升模型的普适性和鲁棒性。此外,当前自监督预训练未充分利用放射学报告文本信息,未来可探索影像与文本的联合自监督训练,以挖掘更丰富的跨模态特征。结合其他影像模态(如MRI、PET)及病理图像,有望进一步提升模型对肿瘤生物学行为的理解。此外,多中心、多设备和不同扫描协议下的验证同样必要,以确保临床应用的可靠性。</p> <p><span style="color: #808080; font-size: 12px;">原始出处</span></p> <p><span style="color: #808080; font-size: 12px;">Yang J, Cai D, Liu J, et al. CRCFound: A Colorectal Cancer CT Image Foundation Model Based on Self-Supervised Learning.&nbsp;<em>Adv Sci (Weinh)</em>. Published online August 12, 2025. doi:10.1002/advs.202407339</span></p>, belongTo=, tagList=[TagDto(tagId=539, tagName=结直肠癌), TagDto(tagId=24076, tagName=CT影像)], categoryList=[CategoryDto(categoryId=5, categoryName=肿瘤, tenant=100), CategoryDto(categoryId=84, categoryName=研究进展, tenant=100), CategoryDto(categoryId=20656, categoryName=梅斯医学, tenant=100)], articleKeywordId=0, articleKeyword=, articleKeywordNum=0, guiderKeywordId=0, guiderKeyword=, guiderKeywordNum=0, opened=1, paymentType=1, paymentAmount=0, recommend=0, recommendEndTime=null, sticky=0, stickyEndTime=null, allHits=1103, appHits=0, showAppHits=0, pcHits=182, showPcHits=1103, likes=0, shares=0, comments=0, approvalStatus=1, publishedTime=Tue Aug 26 11:58:00 CST 2025, publishedTimeString=2025-08-26, pcVisible=1, appVisible=1, editorId=6529310, editor=消化新前沿, waterMark=0, formatted=0, deleted=0, version=4, createdBy=37035155447, createdName=MedSci xAi, createdTime=Tue Aug 26 09:26:48 CST 2025, updatedBy=92910, updatedName=rayms, updatedTime=Tue Aug 26 12:06:08 CST 2025, ipAttribution=上海, attachmentFileNameList=[AttachmentFileName(sort=1, fileName=Advanced Science - 2025 - Yang - CRCFound A Colorectal Cancer CT Image Foundation Model Based on Self‐Supervised Learning.pdf)], guideDownload=1, surveyId=null, surveyIdStr=null, surveyName=null, pushMsXiaoZhi=true, qaList=[{id=934695, encryptionId=d28c9346957e, articleId=ee2e8936e319, userName=administrator, question=未来如何进一步提升CT影像的分子分型预测能力?, answer=可探索:①联合动态增强CT参数反映血管生成特性 ②融合PET代谢信息 ③引入病理图像空间对应关系建立跨模态关联。, clickNum=0, type=article, createdAt=1756357011948, updatedAt=1756357011948}, {id=934691, encryptionId=fb509346913c, articleId=ee2e8936e319, userName=administrator, question=与传统影像组学相比,基于ViT的模型在结直肠癌分析中有何突破?, answer=ViT的自注意力机制能全局建模肿瘤-周围组织关系,尤其擅长捕捉远处转移(M分期)的细微征象,而传统方法多依赖局部手工特征。, clickNum=0, type=article, createdAt=1756357011948, updatedAt=1756357011948}])
Advanced Science - 2025 - Yang - CRCFound A Colorectal Cancer CT Image Foundation Model Based on Self‐Supervised Learning.pdf
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2278807, encodeId=d2fb22e880793, content=<a href='/topic/show?id=493ae869206' target=_blank style='color:#2F92EE;'>#结直肠癌#</a> <a href='/topic/show?id=519b545924' target=_blank style='color:#2F92EE;'>#CT影像#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=66, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=5459, encryptionId=519b545924, topicName=CT影像), TopicDto(id=78692, encryptionId=493ae869206, topicName=结直肠癌)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cade5395722, createdName=梅斯管理员, createdTime=Tue Aug 26 12:06:08 CST 2025, time=2025-08-26, status=1, ipAttribution=上海)]
    2025-08-26 梅斯管理员 来自上海

相关资讯

Front Immunol:粪便免疫化学检测、M3基因、KRAS突变和肿瘤甲基化负荷单独或联合在结直肠癌中的诊断准确性评估

KRAS突变、M3基因和甲基化负荷的三联组合是结直肠癌早期诊断的高效策略,其优越的AUC值和稳定性为临床转化奠定了坚实基础。

Adv Sci:浙江省肿瘤医院朱骥等团队研究发现FOXP4通过抑制铁死亡诱导结直肠癌放射抗性

该研究旨在利用患者来源的类器官(PDOs)鉴定放射抗性基因并阐明其潜在的分子机制。

吴小剑/高峰/王连生团队Adv Sci:发布首个结直肠癌CT影像大模型CRCFound,赋能多任务精准诊疗

该研究通过开放预训练模型,为解决医学影像领域标注数据稀缺问题提供了有效范式,并为全球CRC研究提供了强大的基础工具。

Adv Sci:厦门大学联合中山大学提出结直肠癌CT影像基础模型CRCFound,推动结直肠癌精准诊断

CRCFound采用自监督学习预训练5千余例结直肠癌CT影像,显著提升多项临床任务表现,实现术前精准分期、分子亚型预测及预后评估,推动结直肠癌个性化治疗进展。

OncoImmunology:结直肠癌分子亚型特异性:免疫检查点的空间分布差异与表达特征

本研究旨在探讨不同分子亚型(如KRAS和BRAF突变状态)对结直肠癌中免疫检查点表达的影响,并评估其潜在的临床预测价值。

JAMA Network Open:老年结直肠癌患者奥沙利铂治疗的关键阈值,70 岁以上III期患者无显著生存改善

在II-III期结直肠癌患者中,奥沙利铂辅助化疗的生存获益存在年龄和疾病分期依赖性:对于III期患者,70岁是关键年龄阈值,≤70岁患者可从奥沙利铂治疗中显著获益,而>70岁患者无显著生存改善。

绘真约大咖 | 李玉意教授:紧跟2025年结直肠癌指南更新,看分子检测怎样助力精准用药决策

结直肠癌是威胁人类健康的主要恶性肿瘤之一,全球癌症统计数据显示,2022年全球新发癌症 1996 万例,结直肠癌仍是发病率居前三的恶性肿瘤。

Briefings in Bioinformatics:机器学习在结直肠癌与肺腺癌预后预测中的公平性评估及偏差缓解策略

在临床应用中应结合多指标评估模型公平性,并针对特定群体优化算法设计。

张海增教授解读2025年结直肠癌外科治疗突破:手术不再是首要和唯一选择!

为我们分享2025年结直肠癌治疗领域最新外科进展,剖析了免疫治疗在结直肠癌治疗中的应用及其对传统手术时机的影响,以及对未来结直肠癌外科发展的展望。

90%的结直肠癌,原来只是一枚小小的肠息肉!

结直肠癌多由腺瘤性肠息肉演变而来,需 5-15 年,分良性、癌前、早癌、浸润转移四阶段,40 岁后发病率上升,40 岁前做肠镜可阻断癌变,预防需控饮食、多运动。