Apr, 2024

超定基的大型语言模型的量化

TL;DR基于 Kashin 表示原理,我们引入了一种数据量化算法,通过将给定的向量、矩阵或张量分解为两个因子,其中第一个因子具有小的无穷范数,而第二个在乘以正交矩阵后也具有相似的限制范数。通过分解后的因子条目意外地集中在几个峰值附近,允许我们有效地通过相应的质心进行量化。我们研究了该方法的理论性质,并在下一个单词预测任务和一组文本分类的下游任务中对我们的压缩算法进行了严格评估。我们的研究结果表明,Kashin 量化在保证数据压缩的同时,实现了竞争性或更高的模型性能质量,标志着数据量化领域的重要进展。