Oct, 2023

通过移除单个样本进行数据剪枝

TL;DR我们提出了一种名为 MoSo 的新型数据修剪方法,旨在从训练集中识别并删除最不具信息的样本,通过衡量从训练集中排除特定样本时经验风险的变化程度来确定每个样本的重要性,通过一个高效的一阶逼近器,仅需要不同训练阶段的梯度信息,实验结果表明,MoSo 在高修剪比率下有效降低性能下降,并在各种情况下取得满意的性能。