Mar, 2024

大型语言模型的差分隐私下一个令牌预测

TL;DR通过对公共LLM输出分布周围的集合投影,并对投影分布进行平均和抽样,PMixED提供了基于模型预测的差分隐私保护方法,比样本级隐私更可靠,并在大规模数据集上胜过DP-SGD。