分类方法与早期糖尿病的比较分析
该研究主要使用机器学习技术,从糖尿病患者的诊断医疗数据中提取知识,探索与疾病相关的各种风险因素,并使用四种流行的机器学习算法来预测糖尿病患者,结果表明 C4.5 决策树比其他机器学习技术具有更高的准确性。
Jan, 2019
为了管理糖尿病而设计适当的治疗计划,医务人员需关注患者剩余寿命以及影响其健康的合并症。本文研究了 65 岁及以上的美国退伍军人中 2 型糖尿病老年患者的 68 个潜在死亡预测因素的结构化数据集,通过组合两个原始目标变量构建了一个新的目标变量,采用多项式逻辑回归与 LASSO 的基准回归模型,在特征选择中采用了卡方检验和信息增益技术,并使用多种分类器构建了不同的模型,然而结果表明所有模型均未达到预期效果,主要原因是原始数据经过编码后的高维度使模型产生了混淆,导致误分类。尽管该研究未产生高性能的预测模型,但视角上的创新为这一问题从多分类的角度进行研究奠定了基础。
Feb, 2024
利用机器学习模型为阿根廷地区特定生成 T2D 和 PD 风险人群预测模型的发展和评估,证明了 RF、DT 和 ANN 方法在分类能力方面表现出色,为阿根廷地区的更复杂模型开发迈出了第一步。
Mar, 2024
该研究使用了 Diabetes 130-US Hospitals 数据集,利用各种传统机器学习模型(如 XGBoost、LightGBM、CatBoost、决策树和随机森林)进行分析和预测了糖尿病患者的再入院情况,并通过自主开发的 LSTM 神经网络进行对比。研究结果显示,LightGBM 是最佳的传统模型,而 XGBoost 位居第二,LSTM 模型在训练准确性较高的情况下存在过拟合问题。研究还使用了 SHAP 值提高了模型的解释性,并指出了实验结果中影响再入院预测的重要因素,如实验室过程数量和出院安排。该研究表明,在预测性医疗模型中,模型选择、验证和解释性是关键步骤,有助于医疗服务提供者设计干预措施,提高糖尿病患者的随访遵从性和管理效果。
Jun, 2024
利用机器学习算法在医疗保健领域可能会放大社会不公和卫生不平等问题;本研究关注于机器学习分类算法在开发和使用过程中遇到的一些普遍性障碍,通过以弗雷明汉冠心病数据为案例,说明了如何选择概率阈值将回归模型转换为分类器,并比较了八种常用机器学习分类算法在不同训练 / 测试场景下的预测性能,以测试它们的普适性和可能引发的偏见问题;得到的研究结果表明,XGBoost 和支持向量机在不平衡数据集上训练存在缺陷,而双重判别式为 I 型是最具普适性的,它在各种训练 / 测试场景下都始终优于其他分类算法;最后,提出了一种用于分类算法的最佳变量层次结构提取方法,并以全量数据、男性和女性的弗雷明汉心脏病数据进行了说明。
Feb, 2024
利用传感器技术和机器学习,我们提出了一种基于批归一化的反向传播神经网络(BPNN)的非侵入性糖尿病诊断方法,通过数据重采样和标准化实现类别平衡,实验结果显示相对传统方法在整体准确度、敏感度和特异度上具有显著提高,特别是在 Pima 糖尿病数据集中达到了 89.81% 的准确度,在 CDC BRFSS2015 数据集中达到了 75.49% 的准确度,在 Mesra 糖尿病数据集中达到了 95.28% 的准确度,凸显了深度学习模型在稳健糖尿病诊断方面的潜力。
Mar, 2024
医疗行业产生大量复杂临床数据,数据挖掘技术在诊断和预测医学数据集中的隐藏模式和知识方面表现出高效性和准确性,并且分类算法中的随机森林以 99.24% 的准确率被证明是预测心脏病的最佳算法。
Dec, 2023
本研究探讨了不同的分类方法,如 L1 逻辑回归、分类树和 L1LR-Tree,在识别恶性疟疾严重程度方面的性能和稳定性,并基于变量分类策略构建了稀疏且稳定的模型,从而提高了临床对恶性疟疾的诊断。
Nov, 2015
提出一种基于物联网边缘 - 人工智能 - 区块链系统的糖尿病预测模型,通过比较实验结果表明,与逻辑回归和支持向量机等现有机器学习方法相比,该模型使用随机森林算法平均预测精度提高了 4.57%,但执行时间较长。
Nov, 2022