Jun, 2024

OutlierTune: 大语言模型的高效通道量化

TL;DROutlierTune 是一种针对 LLMs 激活的高效后训练量化方法,它通过预执行去量化和对称化两个组件,解决了大规模语言模型的激活量化准确性和硬件效率问题。