Sep, 2024

由于数据划分的随机性导致的预测准确性变化及区间估计的公平评估

TL;DR本研究解决了使用机器学习算法构建预测模型时存在的预测准确性不稳定问题,尤其是在数据集随机划分带来的挑战。通过构建33600个糖尿病诊断模型并进行评估,结果表明其预测准确性受到初始状态的影响,因此采用统计区间估计方法对模型的预测准确性进行了公平比较,展现了该方法在提升模型比较公正性方面的潜力。