- 带窗口过滤器的近似最近邻搜索
我们定义和研究了 $ extit {c - 近似窗口搜索}$ 的问题,即在数据集中每个点具有数字标签,并且目标是在任意标签范围内找到 Queries 的最近邻。我们提出并理论分析了基于模块化树结构的方法,用于将解决传统 c - 近似最近邻问 - ACL关于对抗样本的学习表示和影响函数的启示
通过邻近邻居和影响函数以及马氏距离两种方法,将图像处理中的对抗样本检测方法应用到 NLP 中,发现前者在多个强基线上与最新技术相比具有领先性能,同时,新颖的影响函数的使用揭示了 NLP 中对抗性样本的子空间性质与图像处理中的子空间性质的联系 - 射击之前的目标:通过级联补丁检索在一毫秒内实现准确的异常检测和定位
通过重新审视异常检测(AD)的 “匹配” 性质,我们提出了一个新的 AD 框架,它同时具有新的 AD 准确性记录和极高的运行速度。
- 最近邻非自回归文本生成
该研究提出一种新的训练策略,使用最近邻作为 NAR 解码器的初始状态,并进行迭代编辑来改进文本生成质量,结果表明该方法在机器翻译和数据到文本任务上均获得了较高的翻译质量和更少的解码迭代次数。
- 基于超参数优化的邻居图相似性搜索与自动帕累托最优性能和最小期望质量设置
本文介绍一种使用邻居图和优化元启发式算法进行最近邻搜索的自动调谐算法,以自动产生品质和搜索速度的帕累托最优搜索;同时,也使用相同策略产生实现最小品质的索引。我们的方法被描述并与其他最先进的相似度搜索方法进行了基准测试,展示了便利性和竞争力。
- 孪生学习进行降维
本文提出了 TLDR,一种利用自监督学习框架的简单、易于训练并具有广泛适用性的降维方法,通过使用最近邻并引入冗余减少损失来学习变换表示。该方法专注于提高线性降维,在图像和文档检索任务中表现出稳定的优化效果。
- ICML非参数方法的健壮性分析
本研究探讨了当输入数据在经过一些修改后变成对抗性样本时,非参数方法的鲁棒性。结果表明,数据分离较好时,最近邻和核分类器的鲁棒性是最优的,直方图则不是。对于普遍的数据分布,通过对抗裁剪预处理后使用最近邻或核分类器也能实现最优的鲁棒性。
- 深度最近邻异常检测
该研究探讨在使用 Imagenet 预训练特征空间的情况下,最近的自我监督深度方法是否确实优于最近邻方法进行异常检测。通过实验证明,仅使用简单的最近邻方法在准确度,few shot 泛化,训练时间和噪声稳健性方面均优于自我监督方法,同时在图 - CVPR跟随视觉流动:自监督场景光流估计
本文介绍了一种使用自我监督的技术,基于最近邻和循环一致性,来训练场景流模型,从而解决在自动驾驶过程中对高动态环境的非刚性物体移动的计算问题,并且其性能优于当前标注了实际场景流数据的最新的有监督学习方法.
- ICML流数据近邻搜索的次线性内存草图
本条研究提出了史上首个可查询到数据集中最近邻居的亚线性内存草图,并利用局部敏感哈希(LSH)估计器、在线核密度估计和压缩感知相结合来实现稳定查询的子线性内存性能,以取得内存 - 精度权衡的理论效果。
- 利用无监督学习引导新物理搜索
使用无监督学习技术提出一种新的科学应用,通过检测两个数据集之间的差异来增强我们在数据中搜索新现象的能力,建立基于最近邻的统计检验方法对两个样本之间的偏差进行测量,应用于高斯合成数据和模拟暗物质信号的案例中,是一种寻找待进一步研究的感兴趣区域 - 循环神经网络协同过滤
本文提出一种将协同过滤视为序列预测问题的解决方案,应用了循环神经网络中的 LSTM 模型,并将其与标准的最近邻和矩阵分解方法在电影推荐方面进行了比较,表明 LSTM 在项目覆盖和短期预测方面具有竞争力,大大优于其他方法。
- 最近邻近似样本压缩的近似最优解
介绍了第一个针对近邻的样本压缩算法,具有非平凡的性能保证,进一步展示了几乎匹配的困难性下界,提供了对度量空间中基于边界的近邻分类的新见解,并允许我们显著地加强和简化现有的边界定义。