Apr, 2025
TurboQuant:近于最优失真率的在线向量量化
TurboQuant: Online Vector Quantization with Near-optimal Distortion Rate
TL;DR本研究解决了当前向量量化方法在均方误差和内积失真方面的不足,提出了一种新的在线算法TurboQuant,具有近于最优的失真率。通过随机旋转输入向量并应用优化的标量量化器,该方法在多个维度和比特宽度下都能有效保持几何结构,实验结果表明该方法在关键值缓存量化和最近邻搜索任务中,均显著优于现有产品量化技术。