使用机器学习和逻辑回归进行组合,预测接受健康体检的540万名脂肪肝病患者动脉颈动脉斑块风险

2024-01-09 美年健康研究院 美年健康研究院 发表于陕西省

本研究旨在结合机器学习(ML)和Logistic回归的优势,建立一种简单、直观的预测模型,以识别脂肪肝病人群中具有颈部动脉斑块风险的个体,并提供风险分级的分界点,为颈动脉超声检测提供指导。

2023年7月,美年健康研究院和北京大学公共卫生学院共同在国际著名期刊" JMIR Public Health & Surveillance "上发表了一篇题为" Combinatorial Use of Machine Learning and LogisticRegression for Predicting Carotid Plaque RiskAmong 5.4 Million Adults With Fatty Liver DiseaseReceiving Health Check-Ups: Population-BasedCross-pal Study "的研究论文。

图片

1 颈动脉斑块可发展为中风、心肌梗死等作为全球主要死因的疾病。证据显示,脂肪肝病患者中颈动脉斑块的发病率显著增加。然而,与肝脏超声的普及率和脂肪肝病的高检出率不同,由于成本效益等原因,在无症状人群中筛查颈动脉斑块尚未普及,这会导致许多患者未被发现其颈动脉斑块,尤其是患有脂肪肝病的患者。

本研究旨在结合机器学习(ML)和Logistic回归的优势,建立一种简单、直观的预测模型,以识别脂肪肝病人群中具有颈部动脉斑块风险的个体,并提供风险分级的分界点,为颈动脉超声检测提供指导。

研究选取了2017年1月1日至2022年6月30日期间,来自全国除港澳台以外的31个省、自治区和直辖市的5,420,640名美年大健康体检人群作为样本。研究纳入了通过肝脏超声检查诊断为脂肪肝并接受颈动脉超声检查的参与者;对于参加过 2 次或以上检查的体检者,研究纳入了其最完整的记录分析进行;此外,研究排除了年龄小于 18 岁,并且有超过 30% 的潜在预测因子缺失或有心脑血管病史的参与者。

2 研究人员采用随机森林(Random forest,RF)、弹性网络(Elastic net,EN)和极限梯度提升(XGBoost)算法从潜在预测因子中选择重要特征,将三种算法共同识别的重要特征纳入Logistic回归模型,以建立颈动脉斑块预测模型。模型性能由受试者工作特征曲线下面积(AUROC)、校准曲线、Brier评分和决策曲线分析进行评价,并通过来源于美兆健康体检中心的32682名参与者组成的数据集进行外部验证。

此外,研究人员根据Youden指数、预测概率和患病率的分布情况确定了颈动脉斑块的风险分界点,将参与者划分为高风险、中风险和低风险组。并在外部验证集对此风险分界点进行了进一步验证。

图片

Figure:Probability distribution and risk classification plot generated by the carotid plaque prediction model in population with fatty liver disease in (A) internal validation data set and (B) external validation data set. 

3 开发集中,26.23%(1421970/5420640)的研究对象被诊断为患有颈部动脉斑块,外部验证集中,21.64%(7074/32682)的研究对象被诊断为患有颈部动脉斑块。在27个预测因子中,三个ML共同识别的6个重要预测因子为年龄、收缩压、低密度脂蛋白胆固醇(LDL-C)、总胆固醇、空腹血糖和血糖脂肪变性指数(HSI)。

在消除特征之间的共线性问题后,由5个独立预测因子建立的逻辑回归模型在内部验证集中的AUROC为0.831,在外部验证集中的AUROC为0.801,并且表现出良好的校准能力。此外,该研究确定了25%和65%的预测概率值作为风险分界点,用于将个体划分为低风险、中风险和高风险组。

ML和逻辑回归的结合产生了一个简单、实用的颈动脉斑块预测模型,对于颈动脉斑块患者的早期识别和风险评估具有重要的公共卫生意义。

版权声明:
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言
评论区 (1)
#插入话题
  1. [GetPortalCommentsPageByObjectIdResponse(id=2180118, encodeId=f21c218011812, content=<a href='/topic/show?id=7d806121594' target=_blank style='color:#2F92EE;'>#机器学习#</a> <a href='/topic/show?id=4a1e109e57e0' target=_blank style='color:#2F92EE;'>#脂肪肝病#</a> <a href='/topic/show?id=4072109e58c7' target=_blank style='color:#2F92EE;'>#动脉颈动脉斑块#</a>, beContent=null, objectType=article, channel=null, level=null, likeNumber=24, replyNumber=0, topicName=null, topicId=null, topicList=[TopicDto(id=109758, encryptionId=4072109e58c7, topicName=动脉颈动脉斑块), TopicDto(id=61215, encryptionId=7d806121594, topicName=机器学习), TopicDto(id=109757, encryptionId=4a1e109e57e0, topicName=脂肪肝病)], attachment=null, authenticateStatus=null, createdAvatar=null, createdBy=cade5395722, createdName=梅斯管理员, createdTime=Mon Jan 08 21:47:25 CST 2024, time=2024-01-08, status=1, ipAttribution=陕西省)]

相关资讯

Journal of Liver Transplantation:一个简单的机器学习衍生规则以促进肝脏移植中的ERAS途径

这个简单的临床规则旨在作为LT中接近ERAS的中心的患者选择筛查工具,重点是临床安全性和有效性、医生信心和患者满意度。

Psychol. Med.: 精神病性抑郁症缓解的轨迹:通过机器学习识别病情恶化的预测因子

预测恶化亚组成员的最有力因素是缓解期开始时的残余抑郁症状,其次是 RCT 基线时的焦虑评分和终生首次抑郁发作的发病年龄。

IJNS:开发一种机器学习模型以检测轻度认知障碍老年人的抑郁、焦虑和冷漠

研究开发的机器学习模型在检测和区分抑郁、焦虑和冷漠方面表现出强大的分类性能。

Academic Radiology:基于多参数MRI和机器学习的放射组学模型在胰腺癌患者术前风险评估中的应用!

放射组学是一种基于机器学习和人工智能的新兴技术,以高通量提取定量成像特征。放射组学发现了无数的几何轮廓、纹理特征和肿瘤的异质性以协助临床诊断和预后。

ANNALS OF SURGERY:基于机器学习的胰腺十二指肠切除术后胰腺瘘的预测

本文新颖的ML模型在内部和外部验证队列中的表现始终优于之前验证的mFRS,从而证明了其在增强CR-POPF预测方面的通用性和实用性。