Aug, 2024

具有相关样本的岭回归中的风险和交叉验证

TL;DR本研究针对现有岭回归理论假设训练样本独立的局限,提出了一种新颖的方法,利用随机矩阵理论和自由概率来分析数据点的相关性对样本内外风险的影响。研究表明,常规的广义交叉验证估计器在相关数据下无法准确预测外部风险,而在特定条件下提出的CorrGCV方法,可以有效地计算出高维极限下的不偏估计,具有显著应用潜力。