Jul, 2024

Mamba-PTQ: 循环大语言模型中的异常通道

TL;DR本研究论文主要探讨了在资源有限的环境中部署大规模语言模型时,压缩序列输入、对循环层进行后训练量化,并解决激活异常问题的关键领域。