一种纺织品纹样的相似度度量方法

SIGIROct, 2018

一种纺织品纹样的相似度度量方法

A Similarity Measure for Weaving Patterns in Textiles

Sven Helmer, Vuong M. Ngo

TL;DR本研究提出了一种新颖的方法，通过使用超图和提取 k - 邻域多重集对纺织品结构进行表示，从而衡量纺织品间的相似性并在数据集上展示了聚类和查询的效果。

Abstract

We propose a novel approach for measuring the similarity between weaving patterns that can provide similarity-based search functionality for textile archives. We represent textile structures using hypergraphs and extract multisets of k-neighborhoods from these graphs. The resulting mul

weaving patterns textile archives hypergraphs jaccard coefficients cosine measures

发现论文，激发创造

网络中的顶点相似性

本文提出了一种基于顶点相邻度量相似性的方法，通过邻接矩阵迭代计算得到自洽矩阵，测试结果表明该方法可用于计算人工生成和真实网络中的节点相似性。

Oct, 2005

相关系数与语义文本相似度

本研究比较了常见文本向量表示方法中余弦相似度和皮尔逊相关系数等相似度计算方法的优缺点及其适用范围，并提出使用非参数秩相关系数作为相似度计算方法，以提高语义文本相似性任务的性能表现。

May, 2019

基于超立方体的大规模相似度连接、边等周性和距离相关性

该研究探讨了分布式协议用于在大型数据集中查找所有相似向量对的方法，重点关注 Hamming 距离，提出了一种新型组合优化问题来捕捉分析上的核心，展示了边等周形状的设计方法和新的距离相关性界限。

Nov, 2016

基于排名的词向量相似度度量

本文研究了基于词嵌入的语义相似度计算方法，提出了一种基于排名的度量方法，在相似度测量和异常值检测方面表现良好，表明基于排名的度量方法可以提高聚类质量。

May, 2018

量化文本的差异性

本文研究各种文本相异度量方法（包括词汇表、词频分布和向量嵌入表示）在不同的任务（如按作者、主题和时间周期对文本进行聚类）中的性能表现，并分析了这些方法在不同长度文本间的偏差关系。结果表明，Jensen-Shannon Divergence 和基于嵌入的方法对 $h$ 的变化不敏感，而 Jaccard 距离则不一定可靠。

May, 2023

上下文比对：使用度量张量提高余弦相似度测量

本文中，我们提出了使用扩展余弦相似度测量来提高单词相似度任务的性能，我们还探索了这种方法在上下文相同的情况下特别有效的假设，并使用了不同的数据集来进行测试。测试结果显示，使用本文提出的方法可以显著提高相似度任务的性能。

Mar, 2022

基于隐含主题的不同长度文本的相似度比较

本文提出一种文档匹配方法以测量文本相似度，通过将文本在隐藏主题的公共空间中进行比较来弥补长度不可比的文档对之间的词汇、语境和抽象差距，并通过两个匹配任务评估匹配算法并发现它始终广泛优于强基线，揭示了将领域知识纳入文本匹配的好处。

Mar, 2019

词向量集之间的相关性

研究表明，基于单词嵌入的相似性度量方法在无监督语义文本相似性（STS）任务中正在与更复杂的深度学习和专家设计的系统轻松竞争。通过将一个单词嵌入视为标量随机变量的例如 300 个观测值，我们避免了传统的几何方法，使用于基本汇集运算和经典相关系数得到的相似性效果很好，胜过许多最近的方法，同时速度更快且实现容易。此外，研究认为通过重新生成核希尔伯特空间之间的相关算子，可以避免汇集运算并直接比较词嵌入集。正如余弦相似性用于比较单个单词向量一样，我们介绍了中心核对齐（CKA）的一种新颖应用，作为平方余弦相似性的集合的自然推广。同样，CKA 非常易于实现，并享有非常强的实证结果。

Oct, 2019

多尺度卷积集匹配学习的高效图相似度计算

本文介绍了 GraphSim 模型，该模型从直接匹配两组节点嵌入的角度解决了图相似性计算问题，获得了在四个真实世界图数据集上的最先进性能。

Sep, 2018

利用邻域树的关系聚类表达差异性测量

本文介绍了一种新的关系数据相似度量，该相似度量包括属性相似度、关系上下文相似度和超图中的近邻性，并实验验证了它在不同类型数据集上聚类质量的影响，结果表明使用该相似度可以产生更好的聚类效果，优于现有的相似度测量方法。

Apr, 2016