四标记：线性时间推断下的词同步解析

ACLApr, 2019

四标记：线性时间推断下的词同步解析

Tetra-Tagging: Word-Synchronous Parsing with Linear-Time Inference

Nikita Kitaev, Dan Klein

TL;DR提出一种可以将标签分配给句子中每个单词的成分解析算法，该算法使用了当前神经网络结构，可在与现有最先进解析器类似的精确度下实现实质性的速度提升，95.4 F1 测试集结果表明其算法性能优秀。

Abstract

We present a constituency parsing algorithm that, like a supertagger, works by assigning labels to each word in a sentence. In order to maximally leverage current neural architectures, the model scores each word'

constituency parsing algorithm neural architectures tree wsj test set state-of-the-art parsers

发现论文，激发创造

透过标注实现解析

该研究探讨了如何将基于上下文的分析方法转化为标注流程，并通过实验证明：推导树的线性转化和其与输入序列的对齐是实现精确标注标记的最重要因素。

Nov, 2022

组成部分句法分析作为序列标注

该论文介绍了一种将成分解析简化为序列标注的方法，并使用该方法在 PTB 和 CTB 树库上取得了 90.7% 的 F1 得分，成为最快的成分解析器之一。

Oct, 2018

神经组合成分解析

该研究提出了两个快速神经组合模型，用于句法分析，分别是二元模型和多分支模型，它们的理论复杂度是次二次的，实际复杂度较低，其中二元模型在 Penn Treebank 上取得了 92.54 的 F1 分数，并以 1327.2 个句子 / 秒的速度进行解析。同时，该模型结合 XLNet，准确率接近英文句法分析的最新水平，并能够观察到 Penn Treebank、Chinese Treebank 和 Keyaki Treebank（日本）在训练和推理过程中的句法倾向和头向性。

Jun, 2021

一种基于句法跨度的最小神经网络成分句法分析器

本文介绍了一种基于 label 和 span 独立评分的最小神经模型，并证明了该模型不仅与经典的动态规划技术兼容，而且还支持一种基于递归分割的新颖贪心自顶向下推理算法。经实验证明，两种预测方案竞争力强，并且与得分模型的基本扩展相结合，能够实现 Penn Treebank 的单模型最优性能（91.79 F1），并在法语 Treebank 上获得强大的性能（82.23 F1）。

May, 2017

指向式高效组成句法分析

我们提出了一种新的成分分析模型，将分析问题转化为一系列指向任务，支持高效的自上而下编码和学习目标。实验表明，我们的方法在不使用预训练模型的情况下取得 92.78 F1 的结果，使用预训练 BERT，达到了 95.48 F1 和最先进的技术水平相当。此外，我们的方法也在多语种成分分析领域实现了最新的技术进展。

Jun, 2020

解析作为预训练

本文讨论了使用预训练架构（而非解码）进行单语种全刻度句法分析（成分和依赖）的问题，并使用序列标注作为模型，探讨了不同词向量的句法敏感性。实验分析显示，使用预训练编码器的结果优于现有序列标记解析器，F1 评分为 93.5％（PTB）和 78.8％（EN-EWT UD）的限制条件下。

Feb, 2020

更好、更快、更强的序列标注成分解析器

本文提出一种有效的方法来使 constituent parsing 更加准确，通过学习切换标记方案、降低标签集的稀疏性、并细化多任务学习以减少错误传播，加上辅助损失和策略梯度句子级微调等技术，成功优化了英文和中文 Penn Treebanks 数据集的连续标记 constituent parsers 的性能，并在 SPMRL 数据集上实现了更大的性能提升，包括在巴斯克语、希伯来语、波兰语和瑞典语上建立了新的 state of the art。

Feb, 2019

基于神经网络的端到端图形式 TAG 解析

本文介绍了基于图形的 Tree Adjoining Grammar (TAG) 解析器，并使用 BiLSTMs、Highway 连接和字符级 CNNs 来实现，该解析器在全局推理和特征表示方面具有先进性，在短语结构随从词性标注和解析方面性能显著优于以往的结果，并且在解析评估和无界依赖恢复方面实现了最先进的性能。

Apr, 2018

Hexatagging: 投影依存句法分析作为标记化

本文介绍了一种新的依赖性分析器：Hexatagger，通过标记句子中的单词，并使用可能标记的有限集合来构建依赖关系树。我们的方法是完全可并行化的，并获得了 96.4 LAS 和 97.4 UAS 的最新性能。同时，我们的解析器的线性时间复杂度和并行性显着提高了计算效率，比先前的最先进模型快了大约 10 倍。

Jun, 2023

神经句法距离的短语结构句法分析

本课题提出了一种新的句法分析方案，使用语法距离为每个输入句子中的拆分位置预测顺序，以自上而下的方式递归划分输入，相比传统的换卡规约分析方案，本方法不会出现错误累积问题，更易于并行处理，并且在 PTB 数据集中达到了竞争性的单模型判别式解析器性能，同时在 CTB 数据集中优于先前的模型。

Jun, 2018