语义距离的分布度量:一份调查报告
本文研究了语义相关性的自动排名和分布式度量方法相对于本体论度量方法的相对优势和局限性,并提出了可以更符合人类语义相关性观念的度量方法,最后比较了分布式和基于本体论的度量方法,并指出了相关的研究问题。
Mar, 2012
本论文探讨了计算语义相似度的不同方法,比较了分类和分布式语义相似度的不同特点,提出了类别相似度建模的三种加权因素,发现在不同词频、多义性和相似度强度范围内存在语义相似度计算巨大差距。
Sep, 2022
本文研究了分布相似度量的应用,以提高对未见共现情况的概率估计。我们的研究贡献有三个:通过广泛的比较实现了相似度量的分类,通过信息融合确定相似函数类型,介绍一种优秀的函数进行潜在代理分布的量化评估。
Jan, 2000
给定两个语料库,我们想要计算它们之间的单一距离度量(例如,Mauve、Frechet Inception)。我们描述了一种抽象质量,称为 ' 分布性 ',用来说明这些度量的特点。我们量化了该质量,并以平均 Hausdorff 距离和能量距离作为非分布性和分布性距离度量的代表例,可以通过与它们比较其他度量来评估它们的分布性程度。
Oct, 2023
本文分析了超过十余种测量两个短文本的语义相似性的方法,并使用一个新的标记为语义相似性的 14,000 句子数据集证明文献中使用的这些度量标准都不能够足够接近人的判断。虽然有一些最近提出的度量标准提供了具有可比性的结果,但 Word Mover Distance 被证明是目前测量改写文本的语义相似性的最合理的解决方案。
Apr, 2020
这篇论文介绍了基于结构、信息内容和特征的语义相似度测量方法,并针对两个标准基准进行了分类和评估,目的是为研究人员和从业者选择适合其要求的最佳度量提供有效的评估。
Oct, 2013
本篇论文介绍了一种将分布式语义学从单个单词扩展到词对、短语和句子等的方法,通过使用组件词中的成对相似性来比较两个元组,从而实现关系相似性(类比)和组成相似性(释义)之间的转换,并通过监督学习生成组合函数。在衡量单词对之间的关系相似性(SAT 类比和 SemEval 2012 任务 2)和名词修饰短语和单个词之间的组成相似性方面取得了最优结果。
Oct, 2013
本文研究了上下文语言模型的语义相似性属性,并利用 SemCor 和 WordNet 方式进行探索。然后,将该方法应用于更开放的环境,以表征静态和上下文语言模型之间的差异。
Nov, 2021
本文旨在全面概述自然语言处理领域中语义相似度计算的研究现状和各种方法及其优劣,将其归类为基于知识、基于语料库和基于深度神经网络等不同原理的方法,并希望能够促进新研究者的创新思路和实验。
Apr, 2020
通过提出一系列的评估度量,本文对语义相似度度量的特征进行自动和可解释的评估,从而实现了对不同语义相似度度量方法行为的合理比较。通过对经典方法和最新方法的评估,我们的度量揭示了最近开发的度量在识别语义分布不匹配方面变得更好,而经典度量则对表面文本水平的扰动更加敏感。
Nov, 2022