语言学分析、描述与范畴语法的类型学探索 (TheBench 指南)

Jun, 2024

语言学分析、描述与范畴语法的类型学探索 (TheBench 指南)

Linguistic Analysis, Description, and Typological Exploration with Categorial Grammar (TheBench Guide)

Cem Bozsahin

TL;DRTheBench 是一个用于研究自然语言中的单调结构的工具，通过书写单调语法来探索分析，比较各种语言的类别，并从形式 - 意义对中训练语法模型，其中语法是潜在变量。

Abstract

thebench is a tool to study monadic structures in natural language. It is for writing monadic grammars to explore analyses, compare divers

thebench monadic structures monadic grammars categorial grammar syntax

发现论文，激发创造

自然语言处理的分类工具

该论文提出了范畴论和计算语言学之间的翻译作为自然语言处理的基础，结合语法、语义和语用三个方面，以字符串图表达统一的句法结构，利用函子将图表达式计算为逻辑、张量、神经或量子计算的语义，通过组成游戏将生成的函子模型进行组合，从而解决语言处理任务。DisCoPy 是用于计算字符串图的 Python 库的一部分，将得到的范畴、语言和计算结构之间的对应关系描述，并通过组合的自然语言处理应用进行演示。

Dec, 2022

经典线性逻辑、边界理论与类别语法的范畴语义

提出一种基于经典乘法线性逻辑的范畴文法，使用标记的端点将单词组成元组而不是抽象的 λ 项，称为 Multiwords；Multiwords 可以组成一个具有基本代数结构的类别，并且研究它可能有助于理解语言语义和为其他形式主义提供分类表示。

Oct, 2018

Lambek vs. Lambek: Lambek 演算的函子向量空间语义与弦图

使用 DisCoCat 模型构建的语义理论在 Lambek 的 pregroup 语法和单调性生物闭合类别中得到了进一步的扩展，并利用矢量空间模型建立了完整句子的向量。

Feb, 2013

贝叶斯大脑组合理论的数学基础

本篇论文应用类别论工具给出了一种关于主动推理和 Bayesian 大脑的构成性解释，定义了 Bayesian 镜头并且使用它们解释了 Bayesian 升级，在此基础上我们定义了统计游戏的类别，并使用它们对各种统计推理问题进行了分类。同时对开放动态系统进行了一种新的形式化定义，并将它们作为镜头控制的动态系统来解释双向的预测编码神经电路构造。

Dec, 2022

类别论定量组合式分布式自然语义模型

本文研究了分布语义学中的组合性问题，使用 Coek，Sadrzadeh 和 Clark 提出的范畴理论框架，将语法分析形式主义与分布语义表示法相结合，生成具体的组合式分布式模型，并展示它们在自然语言处理领域的有效性。研究的贡献包括将 DisCoCat 框架拓展到在句法和语义上，验证模型的优势以及提出了在本主题上应用范畴论的未来研究方向。

Nov, 2013

相互作用的概念空间 I：概念的语法组合

介绍了一种扩展基于范畴的表示意义的方法，将其应用于概念空间模型，提出了凸关系范畴，构建了名词、形容词和动词类型的概念空间，通过例子说明了复合短语的构成方式，建立了一种新的认知复合方法。

Mar, 2017

具范畴组合分布语义双代数的自然语言广义量词理论

本文使用分类组成分布语义模型（categorical compositional distributional semantics）结合 Barwise 和 Cooper 的广义量词理论，进行了基于生成语法形式化的抽象范畴组成语义学习。并证明了基于集合的关系实例化的等价性，以及基于向量空间的实例化的有效性。

Feb, 2016

基于语用的语法类别学习

通过一系列代理实验证明，基于习惯和互动的选取和对齐方式，能够推动语言交互更自然的语法范畴与语法模式的形成。

Apr, 2022

范畴深度学习：架构的代数理论

我们提出了一个关于通用框架，用于指定和研究深度学习架构的难题的见解。我们认为目前为止的关键尝试缺乏一个能够将模型必须满足的约束与其实现进行协调的桥梁。我们的提议是应用范畴论 —— 更具体地说，是参数化映射的范畴论，作为一个单一的理论，优雅地包含了这两种类型的神经网络设计。为了支持我们的观点，我们展示了这个理论如何恢复由几何深度学习引起的约束，并介绍了从神经网络的多样化领域中提取的许多架构的实现，如递归神经网络。我们还说明了这个理论如何自然地编码计算机科学和自动机理论中的许多标准结构。

Feb, 2024

古典线性逻辑，流形和范畴语法

使用经典乘性线性逻辑提出一种基于范畴语法的模型，其中单词由连通的、有标记的端点构成的元组表示为 Word cobordisms，这些对象可以组织成一类类似于拓扑 cobordisms 的范畴，作为线性 λ 演算和古典、直觉线性逻辑的模型。

Nov, 2019