AAAIDec, 2023

机器学习算法的泛化分析:最坏情况数据生成概率测度

TL;DR该研究介绍了将最坏情况下的概率度量引入数据中,以表征机器学习算法的泛化能力。最坏情况下的概率度量是 Gibbs 概率度量,并且是相对熵约束下期望损失最大化的唯一解。该研究还通过最坏情况下的数据生成概率度量得出了基本的泛化度量指标,例如期望损失的敏感性、经验风险的敏感性和泛化差距,并恢复了 Gibbs 算法的现有结果,将泛化差距的特征化表述为互信息和劳特纳信息之和。而最坏情况下的数据生成概率度量和 Gibbs 算法之间建立了一种新的类比关系,具体而言,Gibbs 概率度量被确定为模型空间和数据空间的机器学习算法的基本共性。