Feb, 2024

使用多臂赌博机的数据清洗中的数据 Shapley 阈值化

TL;DR通过使用阈值赌徒算法,我们提出了一种迭代方法,快速识别出具有低数据 Shapley 值的实例子集,理论上保证了所提出的方法可以准确选择有害实例。经过各种模型和数据集的实证评估表明,所提出的方法在提高计算速度的同时保持了模型性能。