Aug, 2023

三元奇异值分解作为线性映射中更好的参数化形式

TL;DR我们提出了一种简单而新颖的参数化线性映射形式,称为 Ternary SVD(TSVD)。与传统的奇异值分解(SVD)不同,TSVD 限制了 SVD 中的 U 和 V 矩阵为三值矩阵形式(±1,0)。在计算 U(・)和 V(・)时,TSVD 仅需要加法指令,而无需昂贵的乘法指令。我们提供了直接转换算法和训练转换算法的过渡算法(如后训练量化和量化感知训练)。此外,我们理论上分析了直接转换算法的收敛性。在实验证明,TSVD 可以在各种类型的网络和任务中实现最先进的网络压缩性能,包括当前的基线模型,如 ConvNext、Swim、BERT 和大型语言模型 OPT。