从频率到意义:向量空间语义模型
该研究介绍了一种名为神经向量空间模型(NVSM)的文档表示学习方法,其在新闻文章检索方面表现出很好的效果,该模型使用梯度下降从头开始学习单词和文档的低维表示,同时还能够在语义匹配和词汇匹配上表现良好。
Aug, 2017
论文提出” 基于向量空间模型(VSM)的无标注文本学习算法 “,应用于中学生常见 SAT 考试的语义类比题及名词修饰语语义关系分类中,取得了 47% 和 43.2% 的正确率,性能达到当时最高水平。
Aug, 2005
本研究旨在对传统计数模型、预测模型与现代上下文向量模型(由 Transformer 神经语言模型生成)进行遵循语境学习的分布式语义模型(DSM)评估,结果显示在大多数上下文之外的语义任务和数据集中,静态 DSM 优于上下文化代表性,并揭示了 DSM 之间的不同之处,这些不同涉及词汇项的频率和词性,为调查分布式模型生成的语义空间提供了方法。
May, 2021
该论文提出一种利用马尔可夫过程进行文本话题、同义词和语义领域提取的语义模型,通过数学分析文本中的重复模式的方法,实现了语言无关的数字指纹。这种语言无关的语义表达方式可以让机器阅读器能够自动识别不同语言的中短文本和进行自动单词翻译。
Jul, 2019
本文提出了一个基于向量空间的模型,通过平均场近似,发展了逼近推理程序和蕴涵操作,用于重新解释现有的分布式语义模型(Word2Vec),以近似预测词汇蕴涵关系,通过无监督和半监督实验,在下义词检测方面取得了显著的改进。
Jul, 2016
本文提出了一种基于神经网络的分布式语义建模技术 SPT,通过自然语言文本中的术语自动提取和应用医学或应用于构建术语向量空间模型的基本实体,实现从分布式词表示向分布式术语表示的转换,从而提高传统本体论开发的准确性。
Mar, 2020
本研究旨在通过将两个英文评估集(Wordsim353 和 SimLex999)翻译成意大利语、德语和俄语,并从熟悉该语言的人群工作者那里收集每个数据集的得分,以评估向量空间模型(VSM)在预测人类在其母语下对词汇语义关系的判断方面的能力,结果发现人类的判断结果强烈受到评判语言的影响,而多语言 VSM 的组合可以部分补偿评判语言对人类判断的影响。
Aug, 2015
此研究综述了分布式语义表示的理论背景,介绍了从单词级别向更精细的词义级别转化的方法,并提供了对两种主要分支进行的广泛技术概述;最终,对其重要方面进行了分析与评估。
May, 2018