$π$-增强预组和在语言学中的应用
本文提出了一种数学框架,为自然语言处理中向量空间模型的分布式理论和语法类型的组合理论提供统一的基础,它能够计算词汇的组合成分从而推导出句子的语义信息,具有很高的实用价值。
Mar, 2010
使用DisCoCat模型构建的语义理论在Lambek的pregroup语法和单调性生物闭合类别中得到了进一步的扩展,并利用矢量空间模型建立了完整句子的向量。
Feb, 2013
本研究使用紧闭类别和Frobenius代数为基础,构建了一个单一空间中的分布式语义模型,从而扩展了之前Coecke-Clark-Sadrzadeh提出的句子意义分布模型的应用范围并在多项语言任务上进行了实验证实。
Jan, 2014
本文提出了一种基于向量的主、客体关系代词组合语义的范畴框架,使用Frobenius代数对关系代词的语义建模进行形式化描述,包括在关系从句和修饰名词短语之间传递信息,以及复制、组合和丢弃关系从句的部分等操作,并提出了两种抽象语义的实例,分别基于真理论和语料库统计。
Apr, 2014
本文探讨了语法组合性的各种概念,思考其在自然语言和人工语言领域中的作用,并提出了这些组合性原则对于满足其条件的语言的表达能力应具有非平凡的组合要求。在例子中,我们展示了一种形式化分析,证明了一类能适应 'salva vertitate substitutions' 的语言,这是一种特别强的组合原则,必须满足本文所确定的一种非常自然的组合约束条件。
Jan, 2022
该论文提出了范畴论和计算语言学之间的翻译作为自然语言处理的基础,结合语法、语义和语用三个方面,以字符串图表达统一的句法结构,利用函子将图表达式计算为逻辑、张量、神经或量子计算的语义,通过组成游戏将生成的函子模型进行组合,从而解决语言处理任务。DisCoPy 是用于计算字符串图的 Python 库的一部分,将得到的范畴、语言和计算结构之间的对应关系描述,并通过组合的自然语言处理应用进行演示。
Dec, 2022
本文研究了迭代的不同概念,特别是Elgot迭代和Kleene迭代,并介绍了Elgot单子以及Kleene单子之间的相互关系。同时,引入了一种新的while-monads类,它们类似于Kleene单子,并且能够有效地支持while循环。
Jan, 2023
本文使用Lambek's pregroups和 compositional distributional models of language (DisCoCat)框架,研究了从日语到英语的翻译,作为函子对。通过对pregroups添加修饰,展示了如何处理语言之间的词序变化。
Mar, 2023
该论文提出了一种新颖的基于拓扑学的方法来研究由 orbite-finite 名义化幺半群可以识别的数据语言。该方法引入了顾及全局支持大小的 pro-orbit-finite 名义化拓扑空间并证明其与名义化 Stone 空间同构,并在其上表征了可识别的数据语言。此外,通过引入重要的名义化 Reiterman 拟变种定理,探讨了 pro-orbit-finite 方程的表达能力。
Apr, 2023
提出了一种新的范畴语法家族,通过丰富基本的范畴语法,引入了一个连接操作。证明了这种方式得到的形式与带有连接的上下文无关文法具有相同的表达能力。还证明了带有连接的范畴语法可以自然地嵌入到带有连接和析取操作的Lambek演算中。这进一步意味着可以在带有连接的Lambek演算中定义一个特定的NP完全集。还展示了如何处理与空字符串相关的一些微妙问题。最后,证明了由连词语法生成的语言可以由不带有连接但具有析取的Lambek语法描述。
May, 2024