将半监督特征纳入非连续 Easy-First 成分句法分析中

Sep, 2014

将半监督特征纳入非连续 Easy-First 成分句法分析中

Incorporating Semi-supervised Features into Discontinuous Easy-First Constituent Parsing

Yannick Versley

TL;DR该研究旨在将 EaFi 解析器的适应能力扩展至多种语言，同时利用 SPMRL 2014 共享任务所提供的无标签数据。

Abstract

This paper describes adaptations for EaFi, a parser for easy-first parsing of discontinuous constituents, to adapt it to multiple languages as well as make use of the →

eafi parser easy-first parsing multiple languages spmrl shared task 2014 unlabeled data

发现论文，激发创造

使用轻微上下文敏感文法进行非监督式不连续成分句法分析

研究语法诱导，使用线性无上下文重写系统进行无监督不连续解析，将文法形式限制为二元 LFCRS 并使用张量分解与参数化规则概率得到大量非终端符号，从而能够诱导出具有连续和不连续结构的语言学意义的树。

Dec, 2022

2019 年 SemEval 任务 1 中苏州大学 HLT 小组：将 UCCA 图解析为组成树解析

本文介绍了一种简单的 UCCA 语义图解析方法，将 UCCA 语义图转换为组成树，使用设计的额外标签作为未来恢复远程边缘和不连续节点的标记，并使用现有的句法分析技术。此系统在七个参与系统中的六个英语 / 德语闭合 / 开放跟踪中排名第一，在第七个跨语言跟踪中，它通过使用英语和德语培训数据的语言嵌入方法，将我们的结果排名第二。

Mar, 2019

更好、更快、更强的序列标注成分解析器

本文提出一种有效的方法来使 constituent parsing 更加准确，通过学习切换标记方案、降低标签集的稀疏性、并细化多任务学习以减少错误传播，加上辅助损失和策略梯度句子级微调等技术，成功优化了英文和中文 Penn Treebanks 数据集的连续标记 constituent parsers 的性能，并在 SPMRL 数据集上实现了更大的性能提升，包括在巴斯克语、希伯来语、波兰语和瑞典语上建立了新的 state of the art。

Feb, 2019

使用双向 LSTM 进行最小特征的增量分析

本研究利用双向 LSTM 句子表示模型以及新颖的转移系统，成功实现了依存句法和短语句法的有监督学习，达到了最先进的效果。

Jun, 2016

基于集成的无监督非连续性短语结构分析方法

我们提出了一种新的集成方法来处理无监督的不连续句法分析问题，通过对现有的不连续解析器的多次运行进行平均预测，稳定并提升性能。同时，我们还提供了对于不同二进制和连续性设置下的树平均的综合计算复杂性分析，以及一种高效的精确算法来解决这个任务，实验结果表明我们的方法在三个数据集上优于所有基准，并对我们的方法进行了深入分析。

Feb, 2024

基于连续语音信号的无监督组成结构句法分析中的级联和直接方法

该研究使用无标签口语句子和未成对文本数据进行无监督组成语法分析，比较了通过级联自动语音识别和无监督解析器方法以及直接对连续的词级语音表示进行无监督解析器训练的方法，发现后者解析效果更好。此外，准确的分割也可以实现口语句子的准确解析。最后，该研究显示了无需显式归纳偏差的情况下，直接方法也可以正确学习头波方向性。

Mar, 2023

外语语法

采用领域无关的注意力增强序列到序列模型在一大合成语料库的标注基础上取得了最先进的效果，训练小规模人工标注的数据集时也达到了标准解析器的表现，且较大程度上提高了数据利用率和处理速度。

Dec, 2014

指向式高效组成句法分析

我们提出了一种新的成分分析模型，将分析问题转化为一系列指向任务，支持高效的自上而下编码和学习目标。实验表明，我们的方法在不使用预训练模型的情况下取得 92.78 F1 的结果，使用预训练 BERT，达到了 95.48 F1 和最先进的技术水平相当。此外，我们的方法也在多语种成分分析领域实现了最新的技术进展。

Jun, 2020

一种基于句法跨度的最小神经网络成分句法分析器

本文介绍了一种基于 label 和 span 独立评分的最小神经模型，并证明了该模型不仅与经典的动态规划技术兼容，而且还支持一种基于递归分割的新颖贪心自顶向下推理算法。经实验证明，两种预测方案竞争力强，并且与得分模型的基本扩展相结合，能够实现 Penn Treebank 的单模型最优性能（91.79 F1），并在法语 Treebank 上获得强大的性能（82.23 F1）。

May, 2017

非词汇化基于转移的不连续性成分句法分析

本研究比较基于词汇化和非词汇化的句法分析模型的性能表现，提出了一种基于结构 - 标签转换系统和双向 LSTM 评分系统的非词汇化转换型分析器，结果表明非词汇化模型在处理不连续组分句法结构时具有更好的性能表现，尤其是在英语和德语的领域中。

Feb, 2019