利用跨度注意力机制改进组成结构分析

EMNLPOct, 2020

利用跨度注意力机制改进组成结构分析

Improving Constituency Parsing with Span Attention

Yuanhe Tian, Yan Song, Fei Xia, Tong Zhang

TL;DR本文提出了一种利用跨度注意力和分类跨度注意力的神经图表句法分析方法，通过加入 n-gram 信息，得以更好的建模上下文信息，并在阿拉伯语、中文和英语解析中都取得了最先进的性能。

Abstract

constituency parsing is a fundamental and important task for natural language understanding, where a good representation of contextual information can help this task. n-grams, which is a conventional type of feat

constituency parsing span attention n-grams neural chart-based parsing categorical span attention

发现论文，激发创造

一种基于句法跨度的最小神经网络成分句法分析器

本文介绍了一种基于 label 和 span 独立评分的最小神经模型，并证明了该模型不仅与经典的动态规划技术兼容，而且还支持一种基于递归分割的新颖贪心自顶向下推理算法。经实验证明，两种预测方案竞争力强，并且与得分模型的基本扩展相结合，能够实现 Penn Treebank 的单模型最优性能（91.79 F1），并在法语 Treebank 上获得强大的性能（82.23 F1）。

May, 2017

指向式高效组成句法分析

我们提出了一种新的成分分析模型，将分析问题转化为一系列指向任务，支持高效的自上而下编码和学习目标。实验表明，我们的方法在不使用预训练模型的情况下取得 92.78 F1 的结果，使用预训练 BERT，达到了 95.48 F1 和最先进的技术水平相当。此外，我们的方法也在多语种成分分析领域实现了最新的技术进展。

Jun, 2020

探究神经组成句法分析的非局部特征

本文研究将非局部特征注入本地基于跨度的解析器的训练过程中，通过预测组成成分 n-gram 非局部模式并确保非局部模式与本地成分的一致性，结果显示，我们的方法在 PTB 和 CTB 上均优于自我注意解析器，在 PTB 上达到 BERT 的最新性能（95.92 F1），并在 CTB 上获得强大的性能（92.31 F1）。与基线相比，在多语言和零 - shot 跨领域设置中，我们的解析器也实现了更好或具有竞争力的性能。

Sep, 2021

通过成分测试的无监督解析

本文提出了一种基于无监督成分测试的无监督解析方法。通过使用一组转换和一个无监督的神经接受模型来制定无监督解析器，以生成给定句子的树，通过聚合其成分测试判断来评分。并且通过反复改进预测出的树和提高语法性模型之间的相互作用，进一步提高了准确性。

Oct, 2020

自注意力编码器进行的组成成分句法分析

通过将 LSTM 编码器替换为自注意力机制，能够提高最先进的判别型成分解析器的性能，特别是当用预训练的字词表示时，而且这种方法在 SPMRL 数据集的大部分语言上的性能优于以前的最佳结果。

May, 2018

外语语法

采用领域无关的注意力增强序列到序列模型在一大合成语料库的标注基础上取得了最先进的效果，训练小规模人工标注的数据集时也达到了标准解析器的表现，且较大程度上提高了数据利用率和处理速度。

Dec, 2014

神经成分句法分析器的研究分析

研究了现代和经典的组成分析方法的差异，以及神经网络在此领域的应用。高性能的神经模型代表了最新的工作，实验发现该模型隐式编码了过去语法和词汇表明确提供的信息，暗示这种支撑可以被强大的通用神经机制取代。

Apr, 2018

句法距离引导的局部自注意力机制

本文提出了一种语法指导的本地化自注意力 Transformer，该方法允许直接从外部成分句法分析器中加入语法结构，禁止注意机制通过加权距离较远但语法正确的令牌而不是接近的令牌。实验结果显示，我们的模型可以在从小到大不同规模的机器翻译数据集上持续地提高翻译性能。

Oct, 2022

中文分词与基于跨度的短语结构分析联合

提出了一种方法，通过将额外标签添加到语法分析树中的每个中文字符，来联合进行中文分词和基于跨度的语法成分分析，实验证明该算法在 CTB5.1 上优于最近的联合分词和语法成分分析模型。

Nov, 2022

使用循环神经网络和动态规划进行线性时间成分句法分析

提出了一种基于 RNNs 和动态规划的图结构堆叠和波束搜索的线性时间组成成分句法分析器，通过集成立方剪枝，可以将其运行速度进一步提高到 O（n b log b），相对于图表解析基线，此线性时间解析器在长句子上的速度明显更快，对于话语分析来说速度更快，是单模型端到端系统中在 Penn Treebank 上达到的最高 F1 准确度。

May, 2018