May, 2024

朝向自然机器遗忘

TL;DR机器遗忘通过从预训练模型中消除已学习的特定训练数据,即遗忘数据,以达到消除知识的目的。当前,现有的机器遗忘方法主要是通过修改遗忘数据的标签,并对模型进行微调来实现。然而,这种学习错误信息的过程是不自然的,并且不希望通过不必要地强化错误信息而导致超过遗忘。为了实现更加自然的机器遗忘,我们将剩余数据中的正确信息注入到遗忘样本中,改变其标签。通过将调整后的样本与其标签配对,模型会倾向于使用注入的正确信息,并自然地抑制应该遗忘的信息。尽管这是一个简单的步骤,但这对于自然机器遗忘来说是一个重要的第一步,并且在大幅减少过度遗忘和提高对超参数的鲁棒性方面表现出色,因此具有实际机器遗忘的潜力。