Feb, 2024

大型语言模型对齐的隐私保护指令

TL;DR通过使用合成指令替代真实指令进行数据注释和模型微调,通过定义差分隐私生成合成指令,匹配合成指令和真实指令的分布来实现所需效用,结果表明,使用合成指令进行监督微调的模型优于开源模型。