该论文提出了范畴论和计算语言学之间的翻译作为自然语言处理的基础,结合语法、语义和语用三个方面,以字符串图表达统一的句法结构,利用函子将图表达式计算为逻辑、张量、神经或量子计算的语义,通过组成游戏将生成的函子模型进行组合,从而解决语言处理任务。DisCoPy 是用于计算字符串图的 Python 库的一部分,将得到的范畴、语言和计算结构之间的对应关系描述,并通过组合的自然语言处理应用进行演示。
Dec, 2022
提出一种基于经典乘法线性逻辑的范畴文法,使用标记的端点将单词组成元组而不是抽象的 λ 项,称为 Multiwords;Multiwords 可以组成一个具有基本代数结构的类别,并且研究它可能有助于理解语言语义和为其他形式主义提供分类表示。
Oct, 2018
使用 DisCoCat 模型构建的语义理论在 Lambek 的 pregroup 语法和单调性生物闭合类别中得到了进一步的扩展,并利用矢量空间模型建立了完整句子的向量。
Feb, 2013
本篇论文应用类别论工具给出了一种关于主动推理和 Bayesian 大脑的构成性解释,定义了 Bayesian 镜头并且使用它们解释了 Bayesian 升级,在此基础上我们定义了统计游戏的类别,并使用它们对各种统计推理问题进行了分类。同时对开放动态系统进行了一种新的形式化定义,并将它们作为镜头控制的动态系统来解释双向的预测编码神经电路构造。
本文研究了分布语义学中的组合性问题,使用 Coek,Sadrzadeh 和 Clark 提出的范畴理论框架,将语法分析形式主义与分布语义表示法相结合,生成具体的组合式分布式模型,并展示它们在自然语言处理领域的有效性。研究的贡献包括将 DisCoCat 框架拓展到在句法和语义上,验证模型的优势以及提出了在本主题上应用范畴论的未来研究方向。
Nov, 2013
介绍了一种扩展基于范畴的表示意义的方法,将其应用于概念空间模型,提出了凸关系范畴,构建了名词、形容词和动词类型的概念空间,通过例子说明了复合短语的构成方式,建立了一种新的认知复合方法。
Mar, 2017
本文使用分类组成分布语义模型(categorical compositional distributional semantics)结合 Barwise 和 Cooper 的广义量词理论,进行了基于生成语法形式化的抽象范畴组成语义学习。并证明了基于集合的关系实例化的等价性,以及基于向量空间的实例化的有效性。
Feb, 2016
通过一系列代理实验证明,基于习惯和互动的选取和对齐方式,能够推动语言交互更自然的语法范畴与语法模式的形成。
Apr, 2022
我们提出了一个关于通用框架,用于指定和研究深度学习架构的难题的见解。我们认为目前为止的关键尝试缺乏一个能够将模型必须满足的约束与其实现进行协调的桥梁。我们的提议是应用范畴论 —— 更具体地说,是参数化映射的范畴论,作为一个单一的理论,优雅地包含了这两种类型的神经网络设计。为了支持我们的观点,我们展示了这个理论如何恢复由几何深度学习引起的约束,并介绍了从神经网络的多样化领域中提取的许多架构的实现,如递归神经网络。我们还说明了这个理论如何自然地编码计算机科学和自动机理论中的许多标准结构。
Feb, 2024
使用经典乘性线性逻辑提出一种基于范畴语法的模型,其中单词由连通的、有标记的端点构成的元组表示为 Word cobordisms,这些对象可以组织成一类类似于拓扑 cobordisms 的范畴,作为线性 λ 演算和古典、直觉线性逻辑的模型。
Nov, 2019