Mar, 2024

大规模语言模型的高效剪枝与自适应推理融合

TL;DR用于资源受限设备的大型语言模型结构剪枝方法,在多层结构的基础上,通过自适应建模和融合估计结果实现了对每个子结构的重要性的自适应调整,实验结果表明在主流数据集上相比最先进的方法,平均准确率提高了1.1%,1.02%,2.0%和1.2%。