Feb, 2024

无尺寸采样核心集用于分类

TL;DR通过敏感采样框架,我们对用于分类问题的核心集进一步细化和泛化。这种核心集寻求输入数据的最小可能子集,以便可以在核心集上优化损失函数,并且能够保证与原始数据的逼近保证。我们的分析提供了首个维度无关的核心集,因此大小不依赖于维度。此外,我们的结果很通用,适用于分布式输入,可以使用独立同分布的样本,从而提供了样本复杂度的边界,并且适用于各种损失函数。我们开发的一个关键工具是主要敏感采样方法的一个 Radamacher 复杂度版本,这可能是独立感兴趣的。