Dec, 2023

大型语言模型中学习和遗忘不安全示例

TL;DR即使在第三方定制微调数据中学习不安全内容,大型语言模型(LLMs)也可以采用 “遗忘过滤器” 算法过滤不安全的数据,确保安全,同时不影响后续任务性能。