Apr, 2024
大型语言模型中的数字遗忘: 遗忘方法综述
Digital Forgetting in Large Language Models: A Survey of Unlearning
Methods
Alberto Blanco-Justicia, Najeeb Jebreel, Benet Manzanares, David Sánchez, Josep Domingo-Ferrer...
TL;DR数字遗忘的目标是,通过给定具有不良知识或行为的模型,获得一个新模型,其中不再存在检测到的问题。在大语言模型中,数字遗忘的方法是取消学习方法中目标任务与数据,以达到保护隐私和防止不良内容生成的目的。