今天跟大家一起精读一篇2024年发表于FRONTIERS IN ENDOCRINOLOGY (IF:5.2)的研究性文章Feature selection and risk prediction for diabetic patients with ketoacidosis based on MIMIC-IV.
研究背景
糖尿病酮症酸中毒(DKA)是一种与糖尿病(DM)相关的潜在危及生命的代谢并发症。DKA可导致严重并发症甚至死亡。因此,密切监测DM并采取适当措施防止DKA的发展或迅速对其进行管理是至关重要的。感染是DKA常见诱发因素,约占DKA病例的30-50%。其中又以尿路感染和肺炎最常见。DKA的主要诱因之一是胰岛素不足,继而导致肝脏过量产生酮体,最终导致酮症酸中毒。DKA会对多个器官产生负面影响,包括心脏、肾脏和神经系统。医疗技术的进步使糖尿病的治疗选择取得了重大进展。然而,与DKA相关的发病率和死亡率仍然很高。随着全球DM患病率的持续上升,DKA的发病率也在逐年增加。计算机技术的出现为利用机器学习技术支持医生进行疾病诊断开辟了新的途径。通过利用这些技术,医疗保健专业人员可以潜在地提高诊断的准确性和效率,从而改善患者护理和成本效益。因此,鉴于与DKA相关的高风险和不良预后,开发专门针对该疾病的风险预测模型非常重要。这样的模型可以帮助识别经历DKA风险较高的患者,允许有针对性的干预和预防措施,减轻医疗保健系统和患者的经济负担。
研究摘要
糖尿病酮症酸中毒(DKA)作为糖尿病(DM)常见的急性并发症,其发展迅速,极大地影响患者生活质量。该研究利用机器学习方法来检查对DKA发展有重要贡献的基线特征,旨在有针对性地及早发现和预防DKA。研究从MIMIC-IV数据集中选择2382例符合条件的DM患者,其中合并酮症酸中毒的糖尿病患者1193例,未合并酮症酸中毒的糖尿病患者1186例。研究共纳入42项基线特征。研究首先通过Pearson相关分析和随机森林选择重要特征,识别与DKA相关的相关生理指标。然后,根据42个基线特征,采用logistic回归()对DKA进行单项预测,分析不同生理指标对实验结果的影响。最后,将特征选择与逻辑回归、XGBoost、决策树、随机森林、支持向量机、k近邻分类器等机器学习模型相结合,进行酮症酸中毒的预测。研究结果发现,红细胞压积、血红蛋白、阴离子间隙()、年龄、Charlson合并症指数与酮症酸中毒密切相关。在临床实践中,应特别注意这五个基线特征,做到早发现早治疗,从而降低疾病的发生率。