- 基于密度的等距映射
通过修改最短路径算法并添加 Parzen-Rosenblatt 窗口约束的方法,PR-Isomap 能够将高维属性投影到低维空间,并且在保持信息的同时能够维持局部和全局距离,实现精确医疗中对高危和低危患者的区分。
- 无监督距离度量学习用于多变量时间序列的异常检测
本研究提出了 FCM-wDTW,一种用于多变量时间序列异常检测的无监督距离度量学习方法,通过将原始数据编码成潜在空间,并通过聚类中心揭示正常维度关系,引入局部加权 DTW 到模糊 C 均值聚类,并有效地学习最优潜在空间,通过数据重构实现异常 - 通过张量化的随机投影来改进 LSH
提供了一种基于 CP 和 tensor train (TT) 分解技术的 LSH 方法,适用于欧几里得距离和余弦相似度的张量数据,具有空间高效性。
- 高斯表面模型下的距离和碰撞概率估计
该论文描述了使用连续空间方法估计椭球形机器人模型与将环境表面建模为一组高斯分布之间的碰撞概率、欧几里得距离和梯度。
- 逆距离加权注意力
替换尺度点积注意力为负欧氏距离对网络产生了影响,简化成距离倒数加权插值;在简单单隐藏层网络上训练,使用标准交叉熵损失,倾向于生成包含原型的关键矩阵和相应逻辑回归的值矩阵;同时,我们还展示其结果可通过人工构建的原型增加特殊情况的处理能力,形成 - 利用类别分布的异质性在免范例持续学习中进行优化
无先例的课程增量学习中,使用冻结的特征提取器基于欧氏距离生成类原型并进行分类,然而,欧氏距离在非静态数据学习时表现亚优,特征分布异质。为了解决这个挑战,我们重新考虑适用于课程增量学习的各向异性马氏距离,并经验证明建模特征协方差关系要优于从正 - 聚类的计算理论与半监督算法
提出了一种计算理论和半监督聚类算法,将聚类定义为根据所选的聚类原则和度量方法获得数据分组,使每个组不包含异常值,所有其他示例被认为是边缘点,孤立的异常值、异常簇或未知簇。
- 应用欧几里得距离函数解释和改进扩散模型
本文提出了一种基于去噪扩散模型的新型采样器并给出了收敛性分析及在训练模型上的最新成果。
- 利用多语言序列到序列预训练技术在文本生成与理解中弥合跨语言差距
本文提出了一种通过引入代码切换任务来减少跨语言场景下的数据和任务差异从而提高多语言序列到序列预训练语言模型(multilingual Seq2Seq PLMs) 的性能的方法,实验结果表明该方法显著优于以标准微调策略微调的基准模型 mBAR - 通用 Hopfield 网络:一种单次联想记忆模型的通用框架
本文提出了一个新颖的通用框架,可以将各种神经网络进行相似性、分离性和投影性等方面的比较,研究了类似 Hopfield 网络和现代连续 Hopfield 网络等各种记忆网络的运作机理,并发现在很多任务中,采用欧几里得距离或曼哈顿距离相似度测量 - MM学习 Wasserstein 距离的置换不变网络
通过置换不变网络将样本从概率测度映射到低维空间,使编码样本之间的欧几里得距离反映概率测度之间的 Wasserstein 距离,进一步证明了该网络可以推广到正确计算未见密度之间的距离,并且可以学习到概率分布的第一和第二矩。
- ICLR加速二进制嵌入以保持欧几里得距离
本文提出一种快速、距离保持的二进制嵌入算法,通过对稀疏矩阵进行稳定的噪音形状量化,实现将高维数据集转换为二进制序列,准确地表示了主题和研究领域。
- ECCV通过深度嵌入学习替代模型
本文提出了一种通过最小化近似目标评估指标的替代损失来训练神经网络的技术,其中代理通过深度嵌入来学习,有效性在场景文本识别和检测任务中得到了证明。
- 张量随机投影
介绍了一种基于张量分解格式 —— 张量列车(TT)和 CP 分解格式 —— 的两种张量随机投影映射方法来降低高维张量的维数,从而显著地降低了存储和计算成本,并证明了采用 TT 格式比 CP 格式更能够更快地实现相同的降维效果,相关实验验证了 - SIGIR编辑距离的卷积嵌入
本文提出了一种基于深度学习的 CNN-ED 管道,将编辑距离嵌入欧几里得距离以进行快速近似相似度搜索来优化字符串相似度搜索。实验结果表明,与数据无关的 CGK 嵌入和基于 RNN 的 GRU 嵌入相比,基于 CNN 的嵌入在准确性和效率方面 - 使用音乐启发的嵌入实现准确可扩展的版本识别
本文提出了一种名为 MOVE 的方法来进行音乐版本鉴别,该方法利用三元组损失和硬三元组挖掘策略学习可伸缩嵌入,采用了另一种输入表示方法,并引入了一种新的时间内容概述技术、标准化的潜在空间和专门为版本鉴别设计的数据扩增策略,并在两个公开基准数 - WSDM基于 Spring-Electrical 模型的链路预测
基于弹簧电力模型,提出了一种链接预测算法,通过网络拓扑学和欧几里得距离来评估具有较高预测准确性。
- ACL探究线性词语类比
研究发现,使用向量算术操作可以解决单词类比问题,本文提供了 skip-gram 模型中算术运算符对应的非线性嵌入模型的正式解释,证明了线性子结构存在于向量空间中,通过从技术上的角度证明了降低高频词权重的有效性以及欧氏距离在捕捉单词不相似性问 - ECCV高效率多视点二进制压缩用于可扩展图像聚类
本研究提出了一种名为 HSIC 的方法,它通过二进制压缩彻底超越了传统的图像聚类方法,可以有效地应对大规模多视角图像聚类问题,并成功减少了计算时间和内存占用。
- 度量分解:超越矩阵分解的推荐
提出了一种新的推荐技术,称为 “度量分解”,通过使用欧几里得距离测量用户和项目之间的显式接近度来克服矩阵分解中采用的点积无法满足不等式的问题。实验证明,我们的方法在评分预测和项目排名任务上均优于现有的最先进方法。