Feb, 2023

在联邦学习中通过私有化定制预调优以更好地匹配用户数据

TL;DR介绍了一种用于联合学习的隐私保护方法 —— FreD,该方法使用分布式的差分隐私均值和协方差估计器计算大型语言模型在中央(公共)数据集和联合私人客户数据上生成嵌入的 Fréchet 距离,以可靠和私密的方式评估 Prefinetuning 数据集的质量。使用 FreD,通过以下步骤,演示了一种新的私人 FL 训练方法的概念证明:(1)定制 Prefinetuning 数据集以更好地匹配用户数据(2)Prefinetuning(3)执行 FL-finetuning。