Feb, 2024
使用多臂赌博机的数据清洗中的数据 Shapley 阈值化
Thresholding Data Shapley for Data Cleansing Using Multi-Armed Bandits
Hiroyuki Namba, Shota Horiguchi, Masaki Hamamoto, Masashi Egi
TL;DR通过使用阈值赌徒算法,我们提出了一种迭代方法,快速识别出具有低数据 Shapley 值的实例子集,理论上保证了所提出的方法可以准确选择有害实例。经过各种模型和数据集的实证评估表明,所提出的方法在提高计算速度的同时保持了模型性能。