BriefGPT.xyz
Ask
alpha
关键词
activation-quantization-aware scaling
搜索结果 - 1
EMNLP
通过权重和激活量化提升大型语言模型的计算效率
该研究探讨了大型语言模型的后训练量化,特别是 4 位权重和 8 位激活(W4A8)量化,以提高计算效率,介绍了激活量化感知的缩放(AQAS)和序列长度感知的校准(SLAC)等创新技术,并引入了整数和非规格化表示的混合数据格式(dINT)来解
→
PDF
8 months ago
Prev
Next