传统回归模型完胜机器学习?中国医大最新研究:预测骨质疏松,逻辑回归更胜一筹!
2025-04-19 梅斯学术 MedSci原创
中国医科大学研究对比机器学习与逻辑回归预测老年高心血管风险人群骨质疏松症的效果,发现逻辑回归模型更优,还揭示低钠盐饮食和拷贝数变异 nssv659422 与患病风险显著相关。
传统的回归模型,如线性回归和逻辑回归,已经在临床研究中使用了几十年。而近十年来,近十年来,机器学习技术在临床研究领域异军突起,正逐步获得学术界的广泛关注与青睐。随着计算能力的飞跃式提升与大数据资源的爆发式增长,机器学习方法在处理非线性复杂关系及高维数据方面展现出独特优势。例如,像支持向量机(SVM)、随机森林(RF)、决策树(DT)及极端梯度提升(XGBoost)等机器学习方法已经在临床研究中得到了广泛应用。那么在临床研究的演进历程中,机器学习方法是否终将全面取代传统回归模型的主导地位呢?
近日,来自中国医科大学的研究员们在BMC Geriatrics期刊发表了题为“A cross-pal study comparing machine learning and logistic regression techniques for predicting osteoporosis in a group at high risk of cardiovascular disease among old adults”的研究论文,确定了在预测骨质疏松症时,其传统回归模型优于四种机器学习方法,并且发现低钠盐饮食和拷贝数变异与骨质疏松患病风险显著相关。
一、研究背景
骨质疏松症是一种以骨量低下,骨微结构损坏,导致骨脆性增加,易发生骨折为特征的全身性骨病,已成为全球公共健康的重要议题,尤其是在老年群体中。随着人们寿命延长,患病风险和数量逐渐增加。该病由遗传、生活方式、环境等多因素引起,与骨密度、心血管疾病等发生发展密切相关。
现有研究的风险评估方法多依赖于传统的回归模型,如逻辑回归(LR),已被广泛用于识别风险因素和预测疾病概率。而随着高级统计技术的发展,机器学习(ML)为提高预测准确性提供了有前景的替代方案,像DT、RF、SVM和XGBoost等机器学习方法,构建预测模型会有较高的预测准确度。然而,目前针对老年高心血管疾病风险人群骨质疏松症的预测研究仍较为匮乏,所以本研究致力于比较机器学习和普通回归构建预测模型哪个更好,并探讨骨质疏松症的影响因素和患病概率,为开发老年人心血管疾病高风险预防策略奠定基础。
二、研究方法
本研究共纳入211名高风险心血管患者进行数据收集,使用了LR和四种成熟的ML算法(DT、RF、SVM和XGBoost),结合包括年龄、性别、血糖、甘油三酯(TG)、中风病史、骨折病史等临床数据,构建骨质疏松风险预测模型。
在数据分析过程中,ML数据集按8:2比例随机划分,其中20%作为测试集。基于混淆矩阵的几个性能指标对模型进行评估(包括真阳性(TPs)、真阴性(TNs)、假阳性(FP)和假阴性(FN)、受试者工作曲线下特征面积(AUC)、正确率、召回率、F1得分等)。
LR通过AUC(曲线下面积)评估模型的区分能力;Brier评分和校准曲线评估模型的校准度;根据决策曲线分析(DCA),判断老年人可能会从预测模型中获得什么样的净收益。最后,为确保结果的可靠性,本研究还使用了bootstrap重采样进行内部验证,并通过列线图(nomogram)可视化模型、回归分析,筛选出对骨质疏松有显著影响的关键变量。
三、研究结论
1. 本研究其传统回归模型优于机器学习方法
研究员发现,在预测骨质疏松症时,LR的AUC值为0.751,优于其他机器学习(如SVM0.72,RF0.70,XGBoost模型0.697,DT0.69)。LR不仅具有较高的辨别能力,而且其变量解读清晰,适合临床应用。
2. 低钠盐饮食与骨质疏松的关系
此外,研究表明,低钠盐饮食在老年心血管高风险群体中或能成为骨质疏松症的重要影响因素之一。现有研究较少涉及此领域,本研究为低钠盐饮食干预提供了新的视角。特别是在结合其他临床和遗传因素后,低钠盐的摄入对骨质疏松风险干预具有参考价值。
3. 基因变异与骨质疏松风险的关系
值得注意的是,研究员通过将遗传因素纳入模型,发现基因组结构变异中最常见的变异类型-拷贝数变异(CNV)特别是nssv659422,与骨质疏松症患病风险显著相关。此研究首次将CNV纳入骨质疏松预测模型,为未来个性化医疗和预防干预奠定了基础。
参考来源:
Peng Y, Zhang C, Zhou B. A cross-pal study comparing machine learning and logistic regression techniques for predicting osteoporosis in a group at high risk of cardiovascular disease among old adults. BMC Geriatr. 2025 Mar 29;25(1):209. doi: 10.1186/s12877-025-05840-w. PMID: 40158079; PMCID: PMC11954202.
本网站所有内容来源注明为“梅斯医学”或“MedSci原创”的文字、图片和音视频资料,版权均属于梅斯医学所有。非经授权,任何媒体、网站或个人不得转载,授权转载时须注明来源为“梅斯医学”。其它来源的文章系转载文章,或“梅斯号”自媒体发布的文章,仅系出于传递更多信息之目的,本站仅负责审核内容合规,其内容不代表本站立场,本站不负责内容的准确性和版权。如果存在侵权、或不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。
在此留言

#骨质疏松症# #逻辑回归#
20