Jun, 2024

FedMKT:大型和小型语言模型的联邦互助知识传输

TL;DRFedMKT 是一个参数高效的联邦互相知识转移框架,旨在同时改进服务器端和客户端的大型和小型语言模型,并通过最小编辑距离实现令牌对齐和选择性的互相知识转移,在各种 NLP 文本生成任务中显著提高客户端的小型语言模型性能,并通过 FedMKT 优化的大型语言模型实现了与基于客户端数据直接微调相当的性能,凸显了 FedMKT 的效果和适应性。