May, 2024

大型语言模型上基于联邦领域专用知识迁移的合成数据使用

TL;DR通过差分隐私,利用大型语言模型在私有领域数据上合成样本,并将其用于改进小型语言模型,通过联邦领域特定知识迁移框架 (FDKT) 在保护客户数据隐私的同时,提高小型语言模型的任务性能,实验结果表明与本地私有数据训练相比,在隐私预算小于 10 的情况下,SLMs 的任务性能平均提升约 5%。