- 基于聚类的近似最大内积搜索中的乐观查询路由
本研究旨在研究基于聚类的最近邻搜索中路由问题,通过乐观主义的原则,利用内积分布的矩来乐观地估计最大内积,通过只使用前两个矩实现与现有算法相当准确度的搜索,并且所提出的算法在空间利用上也更为高效。
- 对话状态跟踪中有效且高效的会话检索与隐式文本摘要
基于大型语言模型的少样本对话状态跟踪研究,通过有效且高效的对话检索器,在没有细调数据的情况下,利用对话的文本摘要进行检索并获得显著提升。
- 高维空间中更快的最大内积搜索
本文提出了一种名为 BanditMIPS 的随机算法,解决了在高纬度情况下复杂度至少为 O (根号 d) 的 MIPS 任务。此算法通过自适应子采样和多臂老虎机策略来估计每个原子的内积,并在理论和实验中都得到了证明。
- AAAISAH: 可感知轮换的非对称哈希用于反向 $k$ 最大内积搜索
该论文研究了一种名为 Reverse k-Maximum Inner Product Search (RkMIPS) 的新问题,并提出了一种名为 Shifting-aware Asymmetric Hashing (SAH) 的子二次时间算 - Flashlight:利用有效解码器扩展的可扩展链接预测
该研究通过使用 Flashlight 算法与适应性调整的查询嵌入,提高 HadamardMLP 预测算法中的邻居预测速度,从而为大规模链路预测应用程序开辟了道路。
- AAAI大规模推荐的快速离线策略优化
本研究采用 Monte Carlo 梯度的新估计方法,结合 SNIS 重要性采样估计和快速的最大内积搜索方法,解决了离线最大内积搜索的问题,提出了一个新的策略学习算法。与传统算法相比,该算法在速度和性能方面均得到了优化。
- ICML具有次线性时间复杂度的线性赌博机算法
本篇论文提出了 2 种线性 bandits 算法,并利用最大内积搜索问题求解臂的选择,从而解决了针对极大臂数和缓慢变化的应用困难,扩展了现有的近似最大内积搜索的求解算法并实现了子线性复杂度及减小了损失。应用于在线学习问题中,该算法时间复杂度 - 基于邻近图的最大内积搜索的理解与改进
分析了最大内积搜索中的范数偏差,证明了 ip-NSW 算法的性能优秀是因为其匹配了最大内积搜索的范数偏差,同时提出了 ip-NSW + 算法,通过引入角度相似性图表现出更好的性能表现。
- AAAI一种用于最大内积搜索的贝叶斯赌博算法
本研究提出了第一种无需任何预处理的近似 MIPS 算法,并允许用户控制和限制结果的次优性,该方法将 MIPS 作为最佳 Arm 识别问题,并引入了一种新的赌博问题设置来充分利用 MIPS 的特殊结构,在合成和现实世界数据集上表现优于现有方法 - 高效贪心坐标下降求解组合问题
本文提出一种针对一类非光滑复合问题的贪心更新规则,其中包括 $L1$- 正则化问题,SVM 等应用程序。我们提供了独立于 $n$ 的首个线性收敛速度,并且证明了我们的贪心更新规则提供了类似于光滑情况下所获得的速度提升。此外,我们还展示了我们 - NIPS范数范围局部敏感哈希用于最大内积搜索
该研究提出了 Norm-ranging LSH 的哈希方法,它可以通过将数据集划分为多个子数据集,为每个子数据集建立一个哈希索引,改善 Simple-LSH 中长尾规范化问题,并且证明 Norm-ranging LSH 具有比 Simple - 基于贪心算法的有限预算最大内积搜索
本文研究带有计算开销的 MIPS 问题,通过设计新型的贪心 - MIPS 算法,从而灵活地控制搜索效率与搜索质量的平衡。在半百万个 200 维向量的候选集上,与现有算法相比,贪心 - MIPS 不仅简单易懂,而且速度快且性能好。
- 层次记忆网络
本文研究了一种层级的记忆网络,其内存以分层的方式组织,通过最大内积搜索(MIPS)来在不需要计算所有查询项的情况下快速进行查询,从而相比于传统的软注意机制和硬注意机制,取得了更好的效果,能在大规模的事实问答任务中使用。
- 基于量化的快速内积搜索
我们提出了一种基于量化的方法,用于快速近似最大内积搜索(MIPS),该方法利用一组通过最小化内积量化误差直接学习的码书对每个数据库向量在多个子空间上进行量化。通过子空间量化器的内积和来近似查询到数据库向量的内积。与最近提出的 LSH 方法不 - ICLR聚类在近似最大内积搜索中效率高
本文主要探讨了最大内积搜索的效率问题,提出了一种基于 k 均值聚类算法的简单方法,在保证检索准确率的同时显著提高检索速度,并在两个标准推荐系统基准测试和大词汇量词嵌入上进行了实验证明。
- 针对最大内积搜索(MIPS)的改进非对称局部敏感哈希(ALSH)
本文提供了一种将最大内积搜索问题转化为余弦相似度搜索问题的方法,该方法使用了不对称变换和有符号随机投影进行优化,相较于之前的方法更为高效。
- 用于亚线性时间最大内积搜索(MIPS)的非对称局部敏感哈希(ALSH)
本文提出了第一个可证明的次线性时间算法,用于近似最大内积搜索,该建议也是使用未归一化的内积作为底层相似度度量的第一个哈希算法。