Feb, 2024

多个合成数据集上集成模型的偏差 - 方差分解

TL;DR通过推导多个合成数据集使用的偏差 - 方差分解,我们的理论预测多个合成数据集对于高方差的下游预测器特别有益,并给出了在均方误差和 Brier 得分情况下选择合适数量合成数据集的简单经验法则。在多个真实数据集和下游预测器上评估集成的性能,结果符合我们的理论,表明我们的洞察力在实践中也具有相关性。