ICLRJan, 2023
利用重要性权重进行子集选择
Leveraging Importance Weights in Subset Selection
Gui Citovsky, Giulia DeSalvo, Sanjiv Kumar, Srikumar Ramalingam, Afshin Rostamizadeh...
TL;DR该研究提出了一种基于重要性抽样的子集选择算法,能够在批处理环境中提高模型训练的性能,在可用数据批次中选择样本。该算法在七个公共数据集上的性能明显优于其他子集选择算法,并且在标签信息不可用的主动学习环境中具有竞争力。研究还对其重要权重方法进行了初步的理论分析,证明了泛化和采样率的限制。