Nov, 2023

超级学习者中变量筛选的实际考虑

TL;DR预测函数估计是许多数据分析的基本组成部分。Super Learner 集成是一种特定的层叠实现,具有可取的理论性质,并已成功应用于许多领域。在拟合其他预测算法之前,可以通过在集成中使用包括 Lasso 在内的变量筛选算法来实现维度降低。然而,在 Lasso 在性能较差的情况下,对使用 Lasso 进行维度降低的 Super Learner 的性能尚未完全探讨。我们提供经验证据表明,应使用多样的候选筛选算法来防止任何一个筛选泄漏的性能变差,类似于为 Super Learner 选择预测算法库的指导。