Aug, 2023

鉴真伪:通过高效参数模块操作进行模型缺陷遗忘

TL;DR通过整合“专家”和“反专家”参数,我们提出了一种称为“Ext-Sub”的参数有效模块操作方法,以提高大型语言模型的真实性和去毒性,并在保留通用能力的同时提取和消除“反专家”参数内的缺陷能力。通过对语言模型和数学推理等额外能力进行广泛实验,我们的实证结果表明我们的方法有效地改善了大型语言模型的真实性和去毒性。