利用速率函数理解插值范围内的泛化

Jun, 2023

利用速率函数理解插值范围内的泛化

Understanding Generalization in the Interpolation Regime using the Rate Function

Andrés R. Masegosa, Luis A. Ortega

TL;DR本文提出了一种基于大偏差理论的模型平滑性的新颖描述方法，通过这种平滑性描述方法，阐述了为什么某些插值器能够表现出良好的泛化能力的统一理论解释，以及为什么一系列现代学习技术（如随机梯度下降，$L_2$- 范数正则化，数据增强，不变性结构和过度参数化）都能够发现这些插值器。这些方法提供了互补的程序，使优化器能够偏向更加平滑的插值器，而在这种理论分析下，这些插值器具有更好的泛化误差。

Abstract

In this paper, we present a novel characterization of the smoothness of a model based on basic principles of large deviation theory. In contrast to prior work, where the →

smoothness large deviation theory generalization learning techniques optimizer

发现论文，激发创造

近邻插值器：快速规范增长与插值与泛化之间的权衡

我们研究了接近插值线性回归器的泛化能力，证明了任何接近插值器都表现出快速的范数增长，并且精确表征了插值和泛化之间的渐进权衡。

Mar, 2024

过度拟合还是完美拟合？插值分类和回归规则的风险界限

本文分析局部插值方案，包括几何单纯插值算法和单一加权 k 近邻算法，在分类和回归问题中证明了这些方案的一致性或近一致性，并提出了一种解释对抗性示例的方法，同时讨论了与核机器和随机森林的一些联系。

Jun, 2018

Just Interpolate: 核 “无岭” 回归能够泛化

使用不带显式正则化的核 “无岭” 回归及非线性核函数能完美拟合训练数据，本文分离了最小范数插值解的隐含正则化现象，这是由于输入数据的高维性、核函数的曲率以及数据的几何特性所导致的，并给出了一种数据相关的外样本误差的上界估计。

Aug, 2018

神经网络中的插值相变：懒惰训练下的记忆和泛化

在神经切向（NT）区域的背景下，研究了过参数化现象和它们的推广误差特征，揭示了经验 NT 内核的特征并且证明了测试误差可以被无穷宽内核的核岭回归误差很好地近似。

Jul, 2020

通过等周性得出的强韧普适定律

本文研究通过参数化模型类进行数据插值的现象与深度学习中使用数量远高于方程数的参数进行拟合训练的关系，证明了平滑插值需要的参数数量是简单插值的 $d$ 倍，并将结果解释为改进的模型泛化边界。

May, 2021

分析谱算法在幂律衰减下的泛化误差曲线

通过分析核回归方法的泛化误差曲线，提供了大量分析谱算法和核梯度下降方法的泛化误差曲线的全面特征描述，进而深化了核插值的不一致性和高资格核回归算法的饱和效应等的理解，这些结果极大地改善了我们对训练宽神经网络泛化行为的认识。值得独立关注的新技术贡献是分析函数论证。

Jan, 2024

超参数化和泛化误差：加权三角插值

该论文分析了在过参数化的线性学习问题中，平滑性和低泛化误差之间的关系，并研究了随机傅里叶级数模型，在该模型中，通过等距采样来估计未知傅里叶系数，研究了常规和加权最小二乘估计器的泛化误差，展示了加权三角形插值可以带来较小的过参数化泛化误差。

Jun, 2020

关于学习排序中损失函数的 Lipschitz 连续性和光滑性

本研究探讨了在学习排序问题中，利普希茨连续性和平滑性如何影响泛化误差，并使用∞-norm 改进了现有界限。此外，选择好的范数使得在平滑性假设下，我们证明了介于 1 / 根号 n 和 1/n 之间的比率。

May, 2014

理解泛化误差中过拟合的峰值：$l_2$ 和 $l_1$ 惩罚插值的分析风险曲线

本研究通过引入 MiSpaR（Misparametrized Sparse Regression）模型，表明过拟合峰值不能将经典阶段从现代阶段分隔开，数据内插本身不能保证良好的泛化能力，需要研究不同惩罚项下的内插状态。

Jun, 2019

统一收敛的辩护：通过去随机化来实现泛化，应用于插值预测器

本研究提出通过基于替代学习模型以及条件概率分布进行去随机化以及降噪，提高对于交叉验证数据集的分类效果。

Dec, 2019