在 DisCoCat 中探索传递动词
利用经验分配法对句子进行组合意义建模一直是计算语言学家面临的挑战。我们利用 BNC 数据实现了 Coecke 等人的抽象范畴模型,并进行了评估。实现基于无监督学习的关系词矩阵,应用于其参数的向量。我们的模型在失歧任务上拥有比竞争对手更优异的表现,而随着句法复杂度的增加,结果的普遍改善展示了我们模型的组合能力。
Jun, 2011
本文研究了分布语义学中的组合性问题,使用 Coek,Sadrzadeh 和 Clark 提出的范畴理论框架,将语法分析形式主义与分布语义表示法相结合,生成具体的组合式分布式模型,并展示它们在自然语言处理领域的有效性。研究的贡献包括将 DisCoCat 框架拓展到在句法和语义上,验证模型的优势以及提出了在本主题上应用范畴论的未来研究方向。
Nov, 2013
我们展示了如何在一个组合分布式意义模型中解析 Geach 的驴子句。我们在 DisCoCat(分布式组合范畴)框架的基础上进行了扩展,包括对话、限定词和关系代词的建模。我们提出了一种类型逻辑语法来解析驴子句,其中我们定义了关系和向量空间语义。
Aug, 2023
本论文提出了三种新的方法,一方面提出了基于 Frobenius 代数的抽象框架的具体实例,另外则提出了一种新的组合算法处理不同级别的词汇歧义,并引入了用于解释词汇歧义的量子力学方法。
May, 2015
我们提出了一种新的高阶 DisCoCat(分类组合分布)模型的定义,其中词的意义不是一个图表,而是一个图表值的高阶函数。我们的模型可以看作是基于 lambda 演算的 Montague 语义的变体,其中的原始操作作用于字符串图表而不是逻辑公式。作为特例,我们展示了如何从 Lambek 演算翻译为一阶逻辑中的 Peirce 系统贝塔。这使我们能够在自然语言语义中以纯图表的方式处理高阶和非线性过程:副词、介词、否定和量词。这篇文章中提出的理论定义带有 DisCoPy 的概念验证实现,这是用于字符串图表的 Python 库。
Nov, 2023
使用 DisCoCat 模型构建的语义理论在 Lambek 的 pregroup 语法和单调性生物闭合类别中得到了进一步的扩展,并利用矢量空间模型建立了完整句子的向量。
Feb, 2013
本文研究了表示及物动词语义的三阶张量的学习,使用了基于张量的语义框架,并使用神经网络的标准技术学习张量,并在简单的二维句子空间上进行了选择偏好式任务的测试,并与竞争性基于语料库的基线进行比较,结果有希望,扩展这项工作超越及物动词,并针对更高维的句子空间,是机器学习社区需要考虑的有趣和具有挑战性的问题。
Dec, 2013
本文提供了一种用于实现分布式语义中语义合成模型的矢量空间的具体方法,实现方法基于结构化向量空间及张量积原理,将所有句子的语义矢量存在同一向量空间,并将提出的句子空间设置为两个名词空间的张量积,并通过它们的向量内积来比较句子的语义。
Dec, 2010