Jul, 2023

通过算法相关的 Rademacher 复杂度实现泛化保证

TL;DR算法和数据相关的广义化界限是解释现代机器学习算法的广义化行为所必需的。在这个背景下,存在包括(各种形式的)互信息和基于假设集稳定性的信息论广义化界限。我们提出了一个概念上相关但技术上独特的复杂度度量方法来控制广义化误差,这就是算法和数据相关的假设类的经验Rademacher复杂度。通过结合Rademacher复杂度的标准特性和这个类的方便结构,我们能够(i)获得基于有限分形维度的新界限,这些界限将之前从连续假设类推广到有限假设类,并避免了先前工作中所需的互信息项;(ii)大大简化了最近一个和维度无关的随机梯度下降的广义化界限的证明;(iii)我们轻松恢复了VC类和压缩方案的结果,类似于基于条件互信息的方法。