分布语义学与语言学理论
分布式语义模型已经广泛应用于自然语言处理系统中,但在语言和认知的更广泛理论范围内,分布式语义模型的理论地位仍不清楚。 然而,我们认为传统答案本质上是一个误解,分布式语义模型本身是表达含义的适当模型。
May, 2019
本文研究了分布语义学中的组合性问题,使用 Coek,Sadrzadeh 和 Clark 提出的范畴理论框架,将语法分析形式主义与分布语义表示法相结合,生成具体的组合式分布式模型,并展示它们在自然语言处理领域的有效性。研究的贡献包括将 DisCoCat 框架拓展到在句法和语义上,验证模型的优势以及提出了在本主题上应用范畴论的未来研究方向。
Nov, 2013
本文研究了分类组合分布语义学中的词汇包含问题,使用密度矩阵和量子计算中的部分知识的范畴语义思想提出了一种新的语言模型,并引入了一种新颖而强健的分级量化概念,能够有效地计算概念之间的包含关系。
Jan, 2016
本文提出了一个基于向量空间的模型,通过平均场近似,发展了逼近推理程序和蕴涵操作,用于重新解释现有的分布式语义模型(Word2Vec),以近似预测词汇蕴涵关系,通过无监督和半监督实验,在下义词检测方面取得了显著的改进。
Jul, 2016
本文提出了一种计算分布式含义表示的方法来解决自动识别篇章关系的难题。我们通过结合句子的句法解析树,并使用一种新颖的向下组成算法,计算实体提及的含义表示。这种方法不仅可以预测句子间的篇章关系,还可以预测它们的指代实体提及之间的关系,并在 Penn Discourse Treebank 上取得了优越的表现。
Dec, 2014
本文介绍了基于矢量表示的分布语义模型,扩展到短语和句子,提出了分类组合分布语义学理论框架,实现了短语和句子层面的言外推理,并通过实验论证了基于密度矩阵的熵距离在词语和短语、句子层面的言外推理可行性和优越性。
Dec, 2015
本文研究了上下文语言模型的语义相似性属性,并利用 SemCor 和 WordNet 方式进行探索。然后,将该方法应用于更开放的环境,以表征静态和上下文语言模型之间的差异。
Nov, 2021