通过深度度量学习进行后处理可以提高神经语言模型中语义相似度推断的效果,并将层次拟合用于建模 IS-A 层次中的语义相似性细微差别。
Oct, 2022
本文提出了一种通过在词汇分类结构和语料统计信息之间进行结合从而更好地度量语义空间内节点间语义距离的方法。这种综合方法结合了基于边缘计数方案的边缘方法和基于信息内容计算的节点方法,实现了对词对相似性评分数据集的超越性表现,与人类相似性判断的基准最高相关性值为 r=0.828,而在人类主体复制相同任务时可以观察到一个上界(r=0.885)。
Sep, 1997
本文研究了向量空间模型在自然语言处理领域的一些应用,通过比较不同模型在 TOEFL 同义词检测中的效果,发现在计算分布相似度时,句法依赖可以更好地解释词汇语义,同时将人工语义知识注入到神经嵌入中可以显著提高同义词检测的效果。
Sep, 2022
本文研究了语义距离的分布式度量方法,比较了这种方法和基于 WordNet 的方法的优缺点,并讨论了混合方法的最新工作。
Mar, 2012
本书主要介绍语义相似度估计及其它语义度量学科的两种最先进的方法:自然语言处理技术和语义模型以及基于语义网络、词库或本体论的计算机可读的知识形式。它的目的是为初学者和研究人员提供更好地理解语义相似度估计和更一般的语义度量。
Apr, 2017
本文旨在了解嵌入式中如何结构性地编码分类信息,通过设计新的上位词 - 下位词探查任务并进行探查研究,我们发现分类嵌入式和主题嵌入式都会编码一些分类信息,但编码的数量和几何特性都独立于编码器架构和嵌入式训练数据。尤其是,我们发现只有分类式嵌入与数据中的底层分布相关,才能携带分类信息。
Jan, 2023
本文提出了一种基于信息内容共享概念的 IS-A 分类法中语义相似度的度量方法。实验评估结果表明,该方法的性能表现优于传统的边计数方法,并展示了利用分类相似性解决句法和语义歧义的算法及其有效性的实验结果。
May, 2011
本文研究了语义相关性的自动排名和分布式度量方法相对于本体论度量方法的相对优势和局限性,并提出了可以更符合人类语义相关性观念的度量方法,最后比较了分布式和基于本体论的度量方法,并指出了相关的研究问题。
本文提出了一种方法,通过使用 UMLS Metathesaurus 的结构信息对医学概念的分布上下文向量表示进行适应性改进,从而提高了链接概念之间向量表示的相似度,极大地提高了自动化方法的性能。
Sep, 2017
本文旨在全面概述自然语言处理领域中语义相似度计算的研究现状和各种方法及其优劣,将其归类为基于知识、基于语料库和基于深度神经网络等不同原理的方法,并希望能够促进新研究者的创新思路和实验。
Apr, 2020