本研究探讨了过参数化模型在插值噪声数据时的行为,分析了数据的协方差结构和高效秩的子空间是如何影响该现象的发生,并提供了正则化条件下的结果。
Sep, 2020
本研究旨在探讨在高斯设计下的核岭回归 (KRR)。我们研究了噪声和正则化之间的相互作用对异常泛化误差的影响,对各种交叉设置进行了表征,并展示了在样本复杂性增加时从无噪声指数到噪声值之间存在过渡。最后,我们证明了这种交叉行为在现实数据集上也是可观测的。
May, 2021
我们对核岭回归的泛化性质在无噪声情况下进行了综合分析,证明了核岭回归能够达到最小最优速率,该速率取决于相关核函数的特征值衰减和目标函数的相对平滑度。
Feb, 2024
在这篇论文中,我们在温和且更现实的假设下,对学习曲线进行了全面的描述,详细阐述了正则化参数、源条件和噪声的选择对学习曲线的影响和相互作用。特别地,我们的结果表明,在噪声水平较小时,' 良性过拟合现象 ' 只存在于非常宽的神经网络中。
Sep, 2023
对于任何有限秩核岭回归 (KRR),我们导出了尖锐的非渐近上下界来衡量其测试误差,并与之前的结果相比,我们的界限更紧密且适用于任何正则化参数。
Oct, 2023
我们推导了核矩阵条件数的新界限,并利用它来增强固定输入维度下过参数化区域中核岭回归的非渐近测试误差界限。对于具有多项式谱衰减的核函数,我们得到了先前工作中的界限;对于指数衰减,我们的界限是非平凡和新颖的。我们关于过拟合的结论有两个方面:(i)具有多项式衰减特征谱的核回归器必须很好地概括,即使在存在有噪声标记的训练数据的情况下也是如此;这些模型表现出所谓的有限过拟合;(ii)如果任何核岭回归器的特征谱呈指数衰减,则它概括能力较差,即表现出灾难性过拟合。这进一步为核岭回归器表现出良性过拟合提供了可用的表征,其中核函数的特征谱以次多项式衰减。我们的分析将新的随机矩阵理论(RMT)技术与核岭回归(KRR)文献中的最新工具相结合。
通过对核岭回归进行一般性等价性和谱特性的分析,证明了从数据中可以获得核运算符的特征分解来近似预测错误,并证明广义交叉验证方法可以用于估计核岭回归的测试误差和最优正则化参数。
Mar, 2024
对于几乎所有常见和现实设置,本论文旨在提供一种统一的理论来上界核回归的超额风险。通过提供适用于常见核函数和任意正则化、噪声、输入维度和样本数量的严格界限,并提供核矩阵特征值的相对扰动界限,揭示了核矩阵的特征值尾部分布形成一种隐式正则化现象,从而实现良好的泛化。本研究的结果适用于高输入维度的良性过拟合、固定维度的近似过拟合以及正则化回归的明确收敛速率。
Dec, 2023
本文探讨了随机特征模型和核岭回归之间的联系,并发现了有限 RF 取样的隐式正则化效应,同时对比了使用 KRR 预测器的风险和使用 RF 预测器的平均风险并获得了它们之间差异的明确界限,最终在实验中发现了平均 λ-RF 预测和 tilde λ-KRR 预测器之间的极好一致性。
Feb, 2020
通过研究神经网络和核脊回归的大维行为,我们确定了核脊回归的泛化误差的精确阶数,并展示了其随 s 的不同取值的曲线如何演化,还发现了饱和效应的存在。
Jan, 2024