ICLROct, 2022

高裁剪率下基于覆盖率的核心集选择

TL;DR本文研究一次性 coreset 选择,提出一种新的度量方法来度量训练数据集在特定分布下的覆盖率,将整体数据覆盖率与每个样本的重要性同时考虑,提出了 Coverage-centric Coreset Selection(CCS)方法,利用 CCS 在高精简率(例如 90%)时得到的精度显著高于之前的 SOTA 方法以及随机选择方法,并且在低精简率时具有类似的精度。