- AiSAQ:全存储 ANNS 与产品量化用于无 DRAM 信息检索
本文提出了一种名为 All-in-Storage ANNS with Product Quantization (AiSAQ) 的方法,通过将压缩向量转移到存储器中,可以在十亿级别的数据集中实现约 10MB 的内存使用,同时还能减少查询之前 - 产品量化及其硬件加速
本文研究了在 DNNs 中将传统的 MAC 操作替换为使用 product quantization 时的计算和内存占用情况,采用不同的 PQ 设置和训练方法,设计了第一个定制的硬件加速器来评估运行 PQ 模型的速度和效率,发现与高度优化的 - 双相增强 IVFPQ 用于时间高效的 Ad-hoc 检索
提出一种新的双相 IVFPQ 框架,结合了两种类型特征:潜在主题和显式术语,通过从深层语义模型中提炼知识来学习文档对不同 IVF 条目的成员资格,从而显著提高索引质量和检索准确性。
- 主动图像索引
本文通过使用主动索引技术优化图像复制检测的鲁棒性,提高了神经网络在大型数据库中的图像检索质量和效率
- PECAN:一种基于产品量化的内容可寻址存储器网络
本文提出了一种新颖的深度神经网络架构,其中滤波和线性变换仅通过产品量化(PQ)实现,从而通过内容可寻址存储器(CAM)实现了自然的实现方式,这超越了普通的 DNN 层操作,只需要简单的查表,结果表明基于产品量化内容可寻址存储器网络(PECA - ICLR可训练嵌入索引中的旋转矩阵学习的 Givens 坐标下降方法
本文提出了一种基于几何直觉的块 Givens 坐标下降算法,用于学习旋转矩阵,具有可证明的收敛性和更高的并行性,可显著优化最近邻搜索中的产品量化方法,在端到端训练方案中取得了更好的性能。
- ICCV深度无监督图像检索的自监督产品量化
提出了 “自我监督产品量化(SPQ)” 网络,它是一个无需标签、自我监督的深度学习图像检索方法,通过比较转换后的图像(视图)来学习深度视觉描述符和码字,分析图像的内容提取其描述性特征,实现准确的图像检索,实验表明在基准测试中得到了业内领先的 - 共同优化查询编码器和产品量化来提高检索性能
本文介绍了一种名为 JPQ 的联合优化方法,该方法结合了查询编码和 Product Quantization,以实现高效的 Dense Retrieval,并在两个公开的评估基准测评中获得了显着的性能提升。
- SIGIR基于产品量化嵌入索引的深度检索模型联合学习
本文提出了一种称为 Poeem 的新方法,它采用了产品量化嵌入索引与深度检索模型联合训练的方法,将嵌入学习和索引构建两个步骤统一起来,从而提高了检索准确率,减少了索引时间,并公开了我们的方法以便于比较和重现。
- EMNLP基于匹配的产品量化技术用于即席检索
本文介绍了匹配导向的产品量化技术 (MoPQ) 及其训练目标 Multinoulli 对比损失 (MCL),通过最小化 MCL 以最大化查询和真实关键字的匹配概率来提高检索准确性。同时,该技术通过可微的跨设备抽样 (DCS) 来大幅增加对比 - 超越产品量化:深度渐进量化用于图像检索
该论文介绍了一种用于大规模图像检索的深度渐进量化模型,该模型学习逐步逼近视觉特征的量化码,并且可以同时训练不同码长的量化码,实现了优于现有技术的图像检索效果。
- 更快的 ADC: 利用 SIMD 解锁产品量化的潜力
该研究提出了 Quicker ADC 算法,利用 SIMD 指令和不规则的产生量化器,实现了更高效的高维空间多媒体检索和最近邻搜索,且优于当前优化实现,并在 FAISS 上实现了开源分支。
- 图像搜索和检索的端到端监督产品量化
该研究提出了 Deep Product Quantization(DPQ)技术,通过学习二元表示,以图像检索和分类为例,具有与 Product Quantization 方法类似的计算复杂度和存储空间,并在多项检索和分类实验中取得了最新的卓 - ICCVSUBIC: 一种用于图片搜索的有监督结构化二进制编码
本研究提出了一种基于深度卷积神经网络实现的、有监督且压缩的、结构化二进制编码的方法。通过使用块 softmax 非线性和基于批次的熵损失,本方法可以使学习到的编码具有结构性,并在单一和交叉领域分类、实例检索和类别检索等任务中,表现出比基于深 - 使用 Quick ADC 加速最近邻搜索
本文提出了一种名为 Quick ADC 的新技术,通过利用当前 CPU 中可用的单指令多数据 (SIMD) 单元,实现了对 ADC 的 3-6 倍加速,并提出了两个关键算法修改,将 8 位子量化器替换为 4 位子量化器和定量化浮点距离。
- 基于 GPU 的十亿级相似度搜索
本文提出了一种优化 k - 选择算法解决高维数据相似度搜索问题的方法,实现了快速且准确的 k - 最近邻图的构建,并在多个方面超越目前的最新 GPU 技术。
- ICLRFastText.zip:压缩文本分类模型
利用乘积量化的方法实现紧凑型文本分类模型,适应存储限制的环境,并通过实验获得更好地平衡准确性和内存占用的性能表现。
- ECCV多义码
该论文考虑了压缩域中的近似最近邻搜索问题,引入了一种叫做 “多义编码” 的方法,在保持了产品量化的距离估算质量和二进制码哈明距离的有效比较性质基础上进行设计,并通过在搜索时二者的双重解释加速了搜索。实验证明,该方法与粗粒度的特征空间分割方法 - 组合向量压缩的堆叠量化器
本文介绍了一种新型的量化方法,采用分层结构的编码本,将向量压缩到二进制码中,相比 Product Quantization 和 Additive Quantization 方法减少了运行时间,并在 SIFT、GIST 描述符和基于卷积神经网 - 优化的 Cartesian K-Means
本文提出了 Optimized Cartesian $K$-Means(OCKM)方法,用于对高维数据进行编码以实现更准确的最近邻搜索,通过多个子码本中的多个子码字进行编码以提供更大的灵活性和更低的失真误差