Feb, 2024

通过机器遗忘实现更安全的大型语言模型

TL;DR通过选择性知识否定消除(SKU)框架,我们可以有效地识别和去除大语言模型中的有害知识,同时保持模型对正常提示的有效性。