摘要:背景:谵妄是危重老年患者的严重并发症。本研究旨在开发可解释的机器学习 (ML) 模型,以预测急性谵妄并确定重症监护病房 (ICU) 老年患者医疗干预的风险因素。
本文用到的谵妄指标可通过工作台提取功能实现数据提取:MIMIC数据库如何提取谵妄阳性患者
题目:可解释的机器学习模型预测重症监护病房老年患者谵妄的急性发生率:一项回顾性队列研究
背景:谵妄是危重老年患者的严重并发症。本研究旨在开发可解释的机器学习 (ML) 模型,以预测急性谵妄并确定重症监护病房 (ICU) 老年患者医疗干预的风险因素。
方法:老年患者 (≥ 岁 65 岁和 ≤ 岁) 选自电子重症监护病房协作研究数据库 (eICU-CRD)。在入住 ICU 的第一天收集人口统计学和实验室检查数据。确定入院后 7 天内出现谵妄。证明了谵妄组和非谵妄组之间的差异。通过 Kaplan-Meier 生存曲线证明了谵妄与死亡率之间的关联。参与者以 7:3 的比例随机分配到训练集和未替换的验证集。递归特征消除 (RFE) 用于确定模型中采用的变量数量。通过受试者工作特征 (ROC) 分析和校准曲线分析证明了 ML 模型的预测能力。该模型的可解释性通过 SHapley 加法解释 (SHAP) 得到证明。
结果:共筛选出 66263 例老年患者,其中 6299 例 (9.5%) 被确定为急性谵妄 (入院后 7 d 内)。谵妄组的住院死亡率高于非谵妄组 (16.32% vs. 10.63%,p = 0.000)。非谵妄患者的累积生存概率显著高于谵妄患者 (p
结论:急性谵妄是重症监护病房老年患者的独立死亡风险。APACHEIV 、脓毒症、机械通气和体温是急性谵妄的重要危险因素,是药物治疗的潜在靶点。
谵妄是老年重症患者的严重并发症:谵妄在老年重症患者中发病率高,尤其是在ICU中,其发病率可达7%~50%,甚至超过80%。谵妄与老年患者的不良预后和长期高死亡率相关,给家庭带来沉重负担。传统谵妄诊断方法的局限性:目前,谵妄的诊断依赖于复杂的临床评分和意识状态评估,如ICU中的CAM-ICU(混乱评估方法)和RASS(Richmond镇静躁动评分)。这些方法需要专业人员进行操作,且较为繁琐。机器学习在医学领域的应用潜力:随着电子医院信息系统的普及,机器学习(ML)方法在医学事件预测中显示出良好的能力,尤其适合处理大量非线性数据。机器学习可以为临床医生提供更高效、更便捷的谵妄预测工具。研究聚焦于老年患者ICU中急性谵妄的预测:以往研究多关注ICU内谵妄、院内谵妄或术后谵妄,但本研究选择预测老年患者在ICU入院后7天内急性谵妄的发生,因为这一时间范围内的谵妄与入院时的临床数据关联性更强,是更准确的预测目标。研究目标:开发可解释的机器学习模型,用于预测老年患者在ICU中急性谵妄的发生,并识别与之相关的风险因素,以帮助临床医生早期识别谵妄并进行干预。02
纳排
03
数据
人口统计学数据:包括患者的年龄、性别和体重。临床评估数据:包括格拉斯哥昏迷评分(GCS)、急性生理与慢性健康评分IV(APACHE IV)、是否插管、是否使用机械通气、是否进行透析。生命体征数据:包括体温、呼吸频率、心率、平均血压。实验室检查数据:包括肌酐、氯化物、血糖、红细胞压积、血红蛋白、血小板计数、血钾、血钠、血尿素氮(BUN)、白细胞计数。诊断与治疗数据:包括是否患有脓毒症、住院时间、机械通气天数、住院死亡情况。谵妄诊断数据:基于国际疾病分类第九版临床修订版(ICD-9-CM)诊断代码或对谵妄的描述来识别入院后7天内急性谵妄的发生。04
统计
生存分析:使用Kaplan–Meier生存曲线分析谵妄组与非谵妄组的生存差异。采用Log-rank检验比较两组的生存率差异。机器学习模型的验证:使用递归特征消除(Recursive Feature Elimination, RFE)选择模型中最具预测能力的变量。采用五折交叉验证(5-fold cross-validation)评估模型的泛化能力。使用网格搜索(Grid Search)优化机器学习模型的超参数。模型预测能力评估:使用接收者操作特征曲线(Receiver Operating Characteristic, ROC)分析计算曲线下面积(AUC)。使用校准曲线(Calibration Curve)分析评估模型预测的准确性。模型可解释性分析:使用SHapley Additive ExPlanations(SHAP)方法解释模型中各变量的重要性及其对预测结果的影响。05
结果
患者特征与谵妄发生率:共纳入66,263名老年患者(年龄≥65岁且≤89岁),其中6,299名患者(9.5%)在入院后7天内发生急性谵妄。谵妄组患者的医院死亡率高于非谵妄组(16.32% vs. 10.63%,p 生存分析结果:Kaplan-Meier生存分析显示,谵妄组的累积生存概率显著低于非谵妄组(p机器学习模型的预测能力:在20个变量被纳入模型时,随机森林(Random Forest, RF)和XGBoost(XGB)模型的预测能力最强,AUC值分别为0.912和0.906。
校准曲线分析显示,XGB和RF模型的预测结果与实际结果拟合良好,Brier分数较低(分别为0.112和0.110)。
关键风险因素:在XGB和RF模型中,最重要的风险因素包括:格拉斯哥昏迷评分(GCS)急性生理与慢性健康评分IV(APACHE IV)脓毒症(sepsis)
其他重要的风险因素还包括机械通气、体温、血尿素氮(BUN)等。
5.模型可解释性分析:
文章引用来源:Hu, X., Luo, J., Liang, H. et al. Interpretable machine learning model to predict the acute occurrence of delirium in elderly patients in the intensive care units: a retrospective cohort study. J Big Data12, 47 (2025). https://doi.org/10.1186/s40537-025-01107-8
来源:医学顾事