Feb, 2024

DB-LLM:用於高效LLMs的準確雙二元化

TL;DR该研究提出了一种新颖的双二值化方法(DB-LLM),用于大型语言模型(LLMs)的超低位量化,以提高计算效率,并通过偏差感知蒸馏(DAD)方法减少预测失真,实现了超低位量化时的显著准确性提升和计算效率降低。