COLINGApr, 2024

多语言脑外科医生:可压缩大型语言模型,保留全部语言

TL;DR本研究介绍了一种新颖的多语言 LLM 压缩方法 ——Multilingual Brain Surgeon(MBS),它通过按照模型训练数据集中语言分布的比例对各种语言进行校准数据抽样,克服了现有方法中以英语为中心的限制,并改善了现有英语为中心的压缩方法在低资源语言上的性能,从而提出了一种创新的多语言 LLM 压缩方法,解决了性能差异和提高了现有压缩技术的语言包容性。