Sep, 2023

通过动态嵌入修剪对预训练语言模型实现令人烦恼的简单记忆效率

TL;DR使用预训练语言模型(PLMs)的广泛内存占用可阻碍其在内存受限环境(如云环境或设备上)的部署。本文提出了一种简单而有效的方法来减小嵌入矩阵的内存占用,从而在保持下游任务性能的同时更有效地利用计算资源。