Sep, 2024

构建“泛化误差”的置信区间——全面基准研究

TL;DR本研究解决了在机器学习中评估预测模型质量时缺乏有效置信区间方法的问题。通过对13种不同方法的系统比较,该研究提出了一种统一框架,明确了各种组合的可靠性,并识别出推荐的方法。研究结果为后续相关研究提供了基础,并通过在OpenML上发布数据集和在GitHub上提供代码,促进了研究的开展。