Sep, 2023

可解释的机器学习预测糖尿病肾病模型

TL;DR通过机器学习方法分析血清代谢物对糖尿病肾病(DN)的影响,预测 DN 的患病率。使用 Least absolute shrinkage and selection operator(LASSO)回归模型和 10-fold 交叉验证选择了最佳特征,通过 AUC-ROC 曲线、决策曲线和校准曲线比较了四种机器学习算法。使用 Shapley Additive explanations(SHAP)方法量化了最佳预测模型中的特征重要性和交互效应。XGBoost 模型在筛选 DN 方面表现最佳,AUC 值最高为 0.966,且相比其他模型具有更多的临床净收益和更好的拟合度。此外,血清代谢物与糖尿病持续时间之间存在显著的相互作用。通过 XGBoost 算法开发了用于筛选 DN 的预测模型,C2、C5DC、Tyr、Ser、Met、C24、C4DC 和 Cys 在模型中具有重要贡献,有可能成为 DN 的生物标志物。