本体论在推荐系统中计算语义相似度的应用
本书主要介绍语义相似度估计及其它语义度量学科的两种最先进的方法:自然语言处理技术和语义模型以及基于语义网络、词库或本体论的计算机可读的知识形式。它的目的是为初学者和研究人员提供更好地理解语义相似度估计和更一般的语义度量。
Apr, 2017
这篇论文介绍了基于结构、信息内容和特征的语义相似度测量方法,并针对两个标准基准进行了分类和评估,目的是为研究人员和从业者选择适合其要求的最佳度量提供有效的评估。
Oct, 2013
本文提出了一种通过在词汇分类结构和语料统计信息之间进行结合从而更好地度量语义空间内节点间语义距离的方法。这种综合方法结合了基于边缘计数方案的边缘方法和基于信息内容计算的节点方法,实现了对词对相似性评分数据集的超越性表现,与人类相似性判断的基准最高相关性值为 r=0.828,而在人类主体复制相同任务时可以观察到一个上界(r=0.885)。
Sep, 1997
本文介绍了 SemSimp,它是一种用于测量数字资源的语义相似性的参数化方法,该方法基于信息内容的概念,并利用参考本体和分类推理,包括不同的方法来对本体的概念进行加权,该方法在 ACM 数字图书馆的基础上进行了实验,并显示出比其他相似性方法更好的结果。
Feb, 2023
使用数学和统计方法通过词汇相似度和共现标签来解决标签的语义相似性问题,建立了基于标签相似性的社区,并使用社区检测方法来确定用户的兴趣,从而改善推荐算法的效果。
Jan, 2022
本论文探讨了计算语义相似度的不同方法,比较了分类和分布式语义相似度的不同特点,提出了类别相似度建模的三种加权因素,发现在不同词频、多义性和相似度强度范围内存在语义相似度计算巨大差距。
Sep, 2022
本文旨在全面概述自然语言处理领域中语义相似度计算的研究现状和各种方法及其优劣,将其归类为基于知识、基于语料库和基于深度神经网络等不同原理的方法,并希望能够促进新研究者的创新思路和实验。
Apr, 2020
本文提出了一种基于词库的、测量文本语义相似性的新方法,称为 Omiotis,它利用了单词之间的语义相关性,将其扩展到文本之间的相关性测量,并在句子相似性和释义识别任务中进行了实验验证,结果显示该方法在选定任务及数据集上表现优异,且与基于语料库和混合方法相媲美,优于所有基于词库的语义相似性方法。
Jan, 2014
本文提出了一种基于主观注释的新型监督学习方法来学习统计句子相关性模型,该模型由大规模背景知识语料库中的文本单位关联的参数化共现统计信息组成,并提出了一种高效的算法来从相关性偏好的训练样本中学习语义模型,方法独立于语料库、适用于任何足够大的(非结构化)文本集合,并且可以为特定用户或用户组拟合语义模型。通过广泛的小到大规模实验结果表明,这种方法是有效的,竞争力强。
Nov, 2013
本文研究了语义相关性的自动排名和分布式度量方法相对于本体论度量方法的相对优势和局限性,并提出了可以更符合人类语义相关性观念的度量方法,最后比较了分布式和基于本体论的度量方法,并指出了相关的研究问题。
Mar, 2012