Dec, 2023
大型和小型语言模型的相互增强与跨系统知识转移
Mutual Enhancement of Large and Small Language Models with Cross-Silo Knowledge Transfer
Yongheng Deng, Ziqing Qiao, Ju Ren, Yang Liu, Yaoxue Zhang
TL;DR提出了一种利用小规模语言模型与大规模语言模型相互提升的方法,通过小规模语言模型生成特定任务的高质量数据,从而显著提高客户端的小规模语言模型和云服务器的大规模语言模型的特定任务性能,同时保持大规模语言模型的泛化能力。