Dec, 2023

教导大型语言模型忘记隐私

TL;DRPrompt2Forget (P2F) 是第一个针对大型语言模型的本地隐私挑战的框架,通过教授大型语言模型遗忘信息的方法,实现模型对敏感信息的遗忘性。实验结果表明 P2F 具有强大的能力,可以模糊大型语言模型的记忆,达到 90%的遗忘性,而无需牺牲其效用。这一发现对于隐私保护领域中的大型语言模型有着深远的影响。