Apr, 2024

无穷假设集的拉什蒙比率

TL;DR在给定分类问题和一系列分类器的情况下,Rashomon 比率度量了产生小于给定损失的分类器所占的比例。我们考虑了无限分类器组的更一般情况,证明了 Rashomon 比率的增加可以保证在从分类器组的随机子集中选择具有最佳经验准确性的分类器,从而提高泛化能力,不会增加太多经验损失。我们通过两个示例量化了无限分类器组中的 Rashomon 比率,以说明其中 Rashomon 比率较大的情况。一种示例是使用线性分类器对正态分布类别进行分类,我们估计了其 Rashomon 比率。另一种示例是当分类器组由双层 ReLU 神经网络组成时,根据修改的 Gram 矩阵,我们得到了 Rashomon 比率的下界。一般来说,我们证明可以使用训练数据集和分类器组的随机样本来估计 Rashomon 比率,并提供了这种估计接近真实 Rashomon 比率值的保证。