XGBoost是最强机器学习算法吗?

B站影视 内地电影 2025-06-09 16:16 2

摘要:广东医科大学附属医院学者用中国老牌数据库CHARLS构建6种机器学习预测模型,以评估COPD患者抑郁症的风险,XGBoost展示了最熟练和最强大的预测性能。

众所周知,机器学习构建预测模型有很多算法,其中,XGBoost是最强的吗?

老郑也确实看过很多机器学习构建预测模型的文章,XGBoost模型优于其他模型。举几个例子。

1.厦大学者用5种机器学习方法构建了心血管预测模型,XGBoost模型的综合性能最佳。

2.广东医科大学附属医院学者用中国老牌数据库CHARLS构建6种机器学习预测模型以评估COPD患者抑郁症的风险,XGBoost展示了最熟练和最强大的预测性能。


今天,老郑要和诸位分享的这篇文章,用10个机器学习算法构建预测模型。

其中,XGBoost模型显示出出色的优势,结果中的 AUC 值为 1,并且具有100%的准确性、灵敏度和特异性,而其他模型表现的却很普通(AUC 0.500-0.725),这一结果无疑令人惊讶DCA 曲线也支持 Xgboost 模型表现最佳。

这篇文章的研究思路比较清晰,构建机器学习预测模型,预测和诊断脑出血 (ICH) 患者的急性肾损伤 (AKI)。

研究思路

数据来源:首先,从 MIMIC-IV 数据库2008-2019年数据中提取符合纳排标准的脑出血(ICH)患者数据。

随机拆分:按7:3分为训练集(n=1299)和测试集(n=557)。

机器学习建模:为了构建模型,利用了各种技术,包括随机生存森林(RSF)、弹性网络(Enet)、最小绝对收缩和选择算子(Lasso)、Ridge回归、逐步逻辑回归(LR)、极限梯度增强(Xgboost)、偏最小二乘回归(PLSR)、监督主成分(SuperPC)、广义增强回归模型(GBM)和支持向量机(SVM)。

交叉验证:为了防止过拟合,在训练和超参数调整期间,所有模型都进行了重复的10倍交叉验证(repeatedcv)。

性能评估:最终的性能指标仅在独立测试集上计算。此外,为了评估临床适用性,进行了决策曲线分析 (DCA)。

与传统模型对比:然后,将十个机器学习模型的预测能力与通常用于预测疾病严重程度和危重患者预后的常规评分系统 (SOFA 和 SAPS II) 进行了比较。

集成模型:此外,一些算法,如Lasso, LR, xgboost和RSF,具有特征选择功能。因此,组合不同算法(如RSF+XGBoost)生成94种组合。

老郑小评

研究者也在文中承认XGBoost模型 AUC=1 可能暗示过拟合。

但强调通过反复交叉验证和严格分离训练和测试数据集,将这种风险降至最低。

并且,关键临床预测因子与已知 AKI 风险因素的一致性进一步支持了该模型的有效性。

另外,不同模型各具优劣,研究者采用不同模型的集成来提高它们的稳健性并降低过拟合的风险,从而使机器学习模型在实际临床应用中更加可靠。

研究者也是“多方认证”,但是,XGBoost 在测试集上 AUC=1.0(准确率/敏感度/特异度均100%),这一结果还需谨慎看待,研究者并未提供独立的外部验证,结果可靠性仍然存疑。

我们很难说明,机器学习哪种算法是最优的,每种方法都有其自身的优缺点,没有任何一种方法是完美的。

一个模型好不好,关键还是数据,而不是统计算法。老郑之前就讲过了!

欢迎诸位看一下原文,看看作者如何在文章中把故事讲明白。

参考文献:

Liu, B., Wu, D., Jiang, Y. et al. A Machine Learning Method for Predicting Acute Kidney Injury in Patients with Intracranial Hemorrhage. Cell Biochem Biophys (2025). https://doi.org/10.1007/s12013-025-01771-w

来源:郑老师讲统计

相关推荐