Apr, 2024

通过基于Hessian-Free的个体数据统计回忆实现高效的在线遗忘

TL;DR机器遗忘旨在维护数据所有者的被遗忘权利,通过使模型有选择地忘记特定的数据。我们提出了一种基于Hessian的在线遗忘方法,通过计算学习模型和重新训练模型之间差异的仿射随机递归近似,为每个数据点维护一个统计向量,实现了几乎瞬时的在线遗忘,只需进行向量相加操作。基于重新收集遗忘数据的统计信息的策略,所提出的方法显著减少了遗忘运行时间。实验研究表明,所提出的方案在时间和内存成本方面的性能超过了现有结果,同时提高了准确性。