Oct, 2023

使用强化学习对语言模型进行私密对齐

TL;DR通过强化学习和差分隐私,研究大型语言模型的隐私保护对齐,实验结果验证了该方法在保护隐私的同时提供了竞争力的效果。