ICLRJan, 2023

利用重要性权重进行子集选择

TL;DR该研究提出了一种基于重要性抽样的子集选择算法,能够在批处理环境中提高模型训练的性能,在可用数据批次中选择样本。该算法在七个公共数据集上的性能明显优于其他子集选择算法,并且在标签信息不可用的主动学习环境中具有竞争力。研究还对其重要权重方法进行了初步的理论分析,证明了泛化和采样率的限制。