CCG 主题电路的流程管道
本文提出了一种新的框架 DisCoCirc,用于使用组合、生成电路来表示文本的语法和语义,证明了针对英语和乌尔都语的限制性片段,DisCoCirc 在消除语言之间的语法差异方面起到了一定作用。
Aug, 2022
本文利用 DisCoCirc 框架,提出了一种适用于自然语言的生成文本电路,该电路独立于语音和语言,并能够在不同表现层次上捕获和更新单词、句子和文本内涵,并通过构建混合语法和翻译过程,实现了文本生成和解析的循环互逆。
Jan, 2023
本文介绍了一种针对近期量子计算机运行的自然语言处理全栈流程 ——QNLP,该流程中所采用的语言模型框架为组合密度语义学(DisCoCat),它扩展和补充了预组语法的组合结构;我们将 DisCoCat 图解释作于近期的量子线路映射,为量子技术运用于自然语言处理开拓了道路。
May, 2020
本研究探讨了 DisCoCirc 模型的不同更新机制以及双重密度矩阵对语义编码的优势,同时将(可交换的)spiders 解释为 Leifer-Spekkens 更新机制的实例。这为在量子硬件上实施文本级自然语言处理提供了基础,先前已确定其具有指数空间增益和二次速度提升的优点。
Jan, 2020
本文主要探讨了基于 DisCoCat 模型的 VQSCs 和 VQTCs 在量子自然语言处理中的应用,并讨论了 DisCoCat 和 DisCoPy 对于对句子进行建模和参数化量子电路编码的方法。但由于 DisCoPy 不支持处理多个句子的文本,因此提出了基于 DisCoCat 模型的三种 VQTCs 方法:基于句子加权的 bag-of-sentences 方法、涉及共同参照的指代消解方法,以及基于 DisCoCirc 模型考虑句子顺序和单词交互作用的文本编排方法,但 DisCoCirc 与 DisCoCat 相比具有更新单词意义的特征,因此尚不清楚 DisCoCirc 能否在 lambeq / DisCoCat 中实现而不破坏 DisCoCat。
Mar, 2023
该论文介绍了我们在 DISRPT2021 共享任务中的贡献,我们的系统 DisCoDisCo 基于 Transformer 的神经分类器,在上下文化的词嵌入上增加手工制作的特征,并依靠标记词序列的方法实现话语分割和联结检测,利用富有特征、无编码器的句子对分类器实现关系分类,我们的结果在前两个任务上优于上一次 2019 共享任务的 SOTA 成绩,并且在关系分类上的结果表明对 2021 年新基准测试具有强大的性能。消融实验表明,包括 CWEs 以外的特征对于两个任务都是有帮助的,多个预训练 Transformer 基于语言模型的局部评估表明,基于 Next Sentence Prediction(NSP)任务预训练的模型是实现关系分类的最佳选择。
Sep, 2021
本文介绍了一种基于 DisCoCat 语言模型和量子计算的方法,实现了四类情感分析的任务,并证明了该方法具有良好的可扩展性。
Sep, 2022
该论文提出了范畴论和计算语言学之间的翻译作为自然语言处理的基础,结合语法、语义和语用三个方面,以字符串图表达统一的句法结构,利用函子将图表达式计算为逻辑、张量、神经或量子计算的语义,通过组成游戏将生成的函子模型进行组合,从而解决语言处理任务。DisCoPy 是用于计算字符串图的 Python 库的一部分,将得到的范畴、语言和计算结构之间的对应关系描述,并通过组合的自然语言处理应用进行演示。
Dec, 2022
我们提出了一种新的高阶 DisCoCat(分类组合分布)模型的定义,其中词的意义不是一个图表,而是一个图表值的高阶函数。我们的模型可以看作是基于 lambda 演算的 Montague 语义的变体,其中的原始操作作用于字符串图表而不是逻辑公式。作为特例,我们展示了如何从 Lambek 演算翻译为一阶逻辑中的 Peirce 系统贝塔。这使我们能够在自然语言语义中以纯图表的方式处理高阶和非线性过程:副词、介词、否定和量词。这篇文章中提出的理论定义带有 DisCoPy 的概念验证实现,这是用于字符串图表的 Python 库。
Nov, 2023