May, 2024
大型语言模型上基于联邦领域专用知识迁移的合成数据使用
Federated Domain-Specific Knowledge Transfer on Large Language Models
Using Synthetic Data
TL;DR通过差分隐私,利用大型语言模型在私有领域数据上合成样本,并将其用于改进小型语言模型,通过联邦领域特定知识迁移框架(FDKT)在保护客户数据隐私的同时,提高小型语言模型的任务性能,实验结果表明与本地私有数据训练相比,在隐私预算小于10的情况下,SLMs的任务性能平均提升约5%。