Jun, 2024

机器反学习无法消除数据投毒攻击

TL;DR我们重新审视了用于大规模深度学习的几种近似机器遗忘方法的功效。虽然现有的遗忘方法在一些评估设置下表现出了有效性,但我们实验证明它们无法消除数据污染的影响,在各种类型的污染攻击和模型中都表现出失败的情况。我们引入了基于数据污染的遗忘评估指标,结果表明需要更广泛的视角来避免对没有可证保证的深度学习机器遗忘程序产生虚假的自信。此外,我们的工作表明尽管遗忘方法在有效消除毒害数据点方面显示出一些迹象且无需重新训练,但目前这些方法还不是 “时机已到”,并且相对于重新训练而言带来的好处有限。