Jan, 2024

简化交叉验证:高效地导出列向正规化和标准化的训练集 X'X 和 X'Y,避免全量重新计算矩阵乘积或统计矩

TL;DR本文介绍了三种有效计算未见数据集上预测模型性能的算法,它们在计算复杂度和正确性方面表现优越,并且相比于直接交叉验证和快速交叉验证的先前工作,它们提供了显著的交叉验证加速,而无需数据泄漏。同时,本文还重点介绍了这些算法与改进的 Kernel PLS 的开源 Python 实现相结合的并行化功能。