Jan, 2024

TOFU:一项针对 LLMs 的虚构遗忘任务

TL;DR利用大规模语言模型训练数据时,即使属敏感或私密的数据也是可以被记忆和复制的,引发了法律和伦理方面的担忧。为了保护个人数据,我们提出了 TOFU(Task of Fictitious Unlearning)作为一个基准,以帮助深入理解遗忘的过程。通过提供一套综合指标,我们评估了现有遗忘算法的基准结果,并指出需要继续努力开发能够真正使模型忘却目标数据的遗忘方法。