Nov, 2023

AWEQ:适用于大型语言模型的后训练量化与激活权重均衡

TL;DR大型语言模型具有卓越的性能,但是它们带来了重大的计算和存储成本。用 8 位权重和激活(W8A8)量化和超低比特量化进行权重和激活量化的 AWEQ 方法使两者的量化难度达到平衡,并实现了最大化的性能。