- KDD利用局部敏感哈希进行快速再描述挖掘
本文介绍了一种基于局部敏感哈希的算法,用于处理纯数值属性的再描述挖掘,以实现更快速的匹配和扩展过程。
- 使用局部敏感哈希的符号回归表达式的非精确简化
本研究提出了一种新颖的符号回归(SR)简化和膨胀控制方法,采用高效的局部敏感哈希(LHS)进行快速记忆化,以在 SR 过程中显著降低模型复杂度并提高收敛性。
- 基于局部敏感哈希的高效点变换器在高能物理中的应用
这项研究介绍了一种专为大规模科学领域(如高能物理学和天体物理学)的点云处理优化的新型 Transformer 模型。通过解决图神经网络和标准 Transformer 的局限性,我们的模型整合了局部归纳偏置,并通过硬件友好的规则操作实现了近线 - k-SemStamp:基于聚类的语义水印用于检测机器生成文本
通过使用 k-means 聚类作为局部敏感哈希的替代方法,k-SemStamp 显著提高了鲁棒性和抽样效率,同时保持了生成质量,是对机器生成文本检测的一种更有效的工具。
- 网络流量指纹识别的局部敏感哈希算法
本研究提出了利用局部敏感哈希技术进行网络流量指纹识别的解决方案,并通过与基于机器学习的流量指纹识别方法的比较,得出了相对于现有方法准确率提高了 12% 的结论,达到了 94% 的网络设备识别准确率。
- DeepLSH:深度局部敏感哈希学习用于快速高效的近似崩溃报告检测
本文研究了如何利用局部敏感哈希(LSH)来解决软件开发过程中自动故障分组的问题,并介绍了 DeepLSH,一种 Siamese DNN 架构和原始损失函数,以逼近 Jaccard 和 Cosine 度量的局部敏感性特性,并通过一系列实验验证 - SemStamp: 文本生成的语义水印及其释义鲁棒性
我们提出了一种基于局部敏感哈希(LSH)的鲁棒的句子级语义水印算法,通过将候选句子编码和 LSH 哈希一个由 LLM 生成的句子,并在语义嵌入空间中进行句子级拒绝采样,直到采样的句子落在带有水印的分区中,通过边缘约束来增强其鲁棒性,实验证明 - 卷积神经网络中使用局部敏感哈希进行即时复杂度降低
通过结构化剪枝方法,利用局部敏感哈希检测通道维度的冗余来压缩潜在特征图,使用 HASTE 模块可以在不需要训练或微调的情况下,即刻降低网络的测试推理成本,有效减少近 47% 的浮点运算量而只损失 1.25% 的准确性。
- 具有理论保证的快速局部敏感哈希
通过随机抽样和随机投影的组合,FastLSH 算法将 LSH 计算的时间复杂度从 O (n) 降低到 O (m)(其中 m < n),并具有可证明的 LSH 属性,是一种有希望替代经典 LSH 方案的方法。
- 基于私有设备局部敏感哈希的大规模分布式学习
使用新的哈希函数族,开发第一个在设备上具有私密性、个性化和内存效率高的局部敏感哈希框架,实现了隐私和个性化,能够与其他 LSH 框架相竞争,训练大规模推荐网络。
- ICML高维图距离、嵌入对齐等场景下能够扩展的最优传输算法
本文提出两种有效的对数线性时间逼近方法来计算熵正则化最优输运问题,并提出了一种结合图神经网络和增强 Sinkhorn 的图输运网络,并实验证明它在节点数量方面具有对数线性的规模,并在图距离回归方面优于以前的模型 48%。
- 基于最长循环共子串的局部敏感哈希方案
这篇论文提出了一种新的基于 LCCS-LSH 框架的 LSH 方案,它引入了 LCCS 的概念和一种新的数据结构 CSA,并支持不同类型的距离度量,能够实现 $c$-ANNS,实验结果表明它的性能优于现有的 LSH 方案。
- ICLRReformer:高效 Transformer
本文介绍了两种技术以提高 Transformer 的效率:使用局部敏感哈希替换点积注意力和使用可逆残差层代替标准残差层,减少存储激活的次数。改进后的模型 Reformer 在处理长序列时比 Transformer 更加高效。
- AAAI实用联邦梯度提升决策树
本文研究了使用局部敏感哈希的 GBDT 在水平联邦学习中的训练,证明了其安全性并且可以显著提高预测准确性。
- ACL通过投影实现对拼写错误鲁棒的设备端文本表达
这篇论文展示了一种基于投影的神经分类器对于输入文本的错拼和扰动具有内在的鲁棒性,并且比使用 BiLSTMs 和精调 BERT 的方法更加稳健。
- 高维情况下基于哈希的核密度估计器
该论文研究了基于局部敏感哈希实现无偏估算的核密度估计数据结构,旨在在高维数据集中实现高效的核密度估计,并提供比单纯随机抽样更好的理论保证。
- ICML基于优先的 DCI 的快速 k 近邻搜索
该研究介绍了一种名为优先的动态连续索引(Prioritized DCI)的变体,用于 k 近邻搜索,并且相对于现有方法(如局部敏感哈希,LSH),优先 DCI 通过线性增加空间而不是查询时间的依赖来解决了维数灾难的问题,并在内在维数方面展现 - NIPS用于角度距离的实用和最优 LSH
证明了存在一种角距离的局部敏感哈希族,可以产生一个渐进最优运行时间指数的近邻搜索算法。同时,提出了这种算法的多探针版本,并在真实和合成数据集上进行实验评估。
- ICLR聚类在近似最大内积搜索中效率高
本文主要探讨了最大内积搜索的效率问题,提出了一种基于 k 均值聚类算法的简单方法,在保证检索准确率的同时显著提高检索速度,并在两个标准推荐系统基准测试和大词汇量词嵌入上进行了实验证明。
- 数据相关局部敏感哈希的紧密下界
证明了不同于传统的局部敏感哈希,数据依赖性哈希在设计高效的近似最近邻搜索算法时明显优越,我们证明了 $
ho$ 的下界,要求哈希函数具有简洁性质。