EMNLPOct, 2023
基于检索的知识迁移:一种有效的极端大型语言模型压缩方法
Retrieval-based Knowledge Transfer: An Effective Approach for Extreme Large Language Model Compression
Jiduan Liu, Jiahao Liu, Qifan Wang, Jingang Wang, Xunliang Cai...
TL;DR我们介绍了一种称为 Retrieval-based Knowledge Transfer (RetriKT) 的新型压缩模型的方法,通过从大规模预训练语言模型中提取知识,构建一个知识存储库,小规模模型可以从中检索相关信息并利用它进行有效推理,实验证明该方法显著提升了小规模模型的性能。