文本结构的数学
本文利用 DisCoCirc 框架,提出了一种适用于自然语言的生成文本电路,该电路独立于语音和语言,并能够在不同表现层次上捕获和更新单词、句子和文本内涵,并通过构建混合语法和翻译过程,实现了文本生成和解析的循环互逆。
Jan, 2023
本研究探讨了 DisCoCirc 模型的不同更新机制以及双重密度矩阵对语义编码的优势,同时将(可交换的)spiders 解释为 Leifer-Spekkens 更新机制的实例。这为在量子硬件上实施文本级自然语言处理提供了基础,先前已确定其具有指数空间增益和二次速度提升的优点。
Jan, 2020
本文提出了一种数学框架,为自然语言处理中向量空间模型的分布式理论和语法类型的组合理论提供统一的基础,它能够计算词汇的组合成分从而推导出句子的语义信息,具有很高的实用价值。
Mar, 2010
提出了 DisCoCirc 模型,用于将自然语言文本表示为电路,以提供可以在经典和量子方法中应用于自然语言处理任务的神经符号模型。此外,还描述了将英语文本转换为 DisCoCirc 表示的软件管道,该管道使用组合的范畴语法解析及核心指代解析信息来转换文本。
Nov, 2023
本文介绍了一种新的基于范畴论和量子力学的自然语言处理方法,通过将词汇进行向量化,并结合 Coecke, Sadrzadeh 和 Clark 提出的分配模型进行词汇的分析和理解,同时采用 Selinger 的 CPM 构造进行词汇多义性的处理,实现了有效的句子意义计算和词汇比较。
Feb, 2015
本文提出了一种新的框架 DisCoCirc,用于使用组合、生成电路来表示文本的语法和语义,证明了针对英语和乌尔都语的限制性片段,DisCoCirc 在消除语言之间的语法差异方面起到了一定作用。
Aug, 2022
本文提供了一种用于实现分布式语义中语义合成模型的矢量空间的具体方法,实现方法基于结构化向量空间及张量积原理,将所有句子的语义矢量存在同一向量空间,并将提出的句子空间设置为两个名词空间的张量积,并通过它们的向量内积来比较句子的语义。
Dec, 2010
本文主要探讨了基于 DisCoCat 模型的 VQSCs 和 VQTCs 在量子自然语言处理中的应用,并讨论了 DisCoCat 和 DisCoPy 对于对句子进行建模和参数化量子电路编码的方法。但由于 DisCoPy 不支持处理多个句子的文本,因此提出了基于 DisCoCat 模型的三种 VQTCs 方法:基于句子加权的 bag-of-sentences 方法、涉及共同参照的指代消解方法,以及基于 DisCoCirc 模型考虑句子顺序和单词交互作用的文本编排方法,但 DisCoCirc 与 DisCoCat 相比具有更新单词意义的特征,因此尚不清楚 DisCoCirc 能否在 lambeq / DisCoCat 中实现而不破坏 DisCoCat。
Mar, 2023
使用 DisCoCat 模型构建的语义理论在 Lambek 的 pregroup 语法和单调性生物闭合类别中得到了进一步的扩展,并利用矢量空间模型建立了完整句子的向量。
Feb, 2013
利用经验分配法对句子进行组合意义建模一直是计算语言学家面临的挑战。我们利用 BNC 数据实现了 Coecke 等人的抽象范畴模型,并进行了评估。实现基于无监督学习的关系词矩阵,应用于其参数的向量。我们的模型在失歧任务上拥有比竞争对手更优异的表现,而随着句法复杂度的增加,结果的普遍改善展示了我们模型的组合能力。
Jun, 2011