高效 EUD 解析

Jun, 2020

Efficient EUD Parsing

Mathieu Dehouck, Mark Anderson, Carlos Gómez-Rodríguez

TL;DRFASTPARSE 团队针对 IWPT2020 的 EUD Shared Task 提出一种训练和推理效率结合的模型，结合神经依存解析和基于规则的系统，将 UD 树映射为 EUD 图，在官方提交中获得 74.04 的平均 ELAS，排名第 4。

Abstract

We present the system submission from the fastparse team for the EUD Shared Task at IWPT 2020. We engaged with the task by focusing on efficiency. For this we considered training costs and inference efficiency. Our models are a combination of distilled →

fastparse eud shared task neural dependency parsers rule-based system elas

发现论文，激发创造

IWPT 2020 共享任務中的 ADAPT 增強依存分析器

该论文介绍了 ADAPT 系统参加 2020 年 IWPT 共享任务的解析增强通用依存关系的方法，采用 UDPipe 和 UDPipe-future 构建管道方法，使用语义依存图解析器或一系列启发式规则来增强依存图，并在语言平均值方面达到了 79.53 分，可以成功实现增强依赖句法分析任务。

Sep, 2020

使用二阶推理和混合训练数据增强通用依存句法分析

该论文提出了一种基于图的解析器系统，并使用二阶推理方法。我们在低资源的泰米尔语语料库中，将泰米尔语的训练数据与其他语言混合使用，显著提高了泰米尔语的性能。尽管我们之前提交了未连接的图，导致在 10 个团队中只排名第六，但我们解决这个问题后，我们的系统比官方排名第一的团队高出 0.6 ELAS。

Jun, 2020

COMBO: 一种新的 EUD 解析模块

该研究介绍了基于 COMBO 的 EUD 分析方法及其实现，其在 IWPT 2021 EUD 共享任务中获得了第四名，平均 ELAS 为 83.79％。

Jul, 2021

Køpsala：基于转移的图解析，通过高效的训练和有效的编码实现

我们提出了 Køpsala 系统，它通过一个统一管道实现了增强型通用依赖关系和意义表示的解析，并利用适应自 Che 等人（2019）的基于转换的图形解析器来完成增强型图形解析。

May, 2020

从零开始的通用依存句法分析

该论文介绍了 Stanford 的 CoNLL 2018 UD 共享任务中的系统，这是一个完整的神经管道系统，可以将原始文本作为输入，并执行共享任务所需的所有任务，从分词和句子分割到词性标注和依赖关系解析，并通过广泛的消融研究展示了不同的模型组件的有效性。

Jan, 2019

深度上下文化词向量、集成和树库连接：迈向更好的 UD 句法分析

本文描述了我们的系统（HIT-SCIR），该系统提交给 CoNLL 2018 共享任务，涉及从原始文本到通用依赖的多语言解析。我们基于斯坦福的获胜系统进行提交和进行了两个有效的扩展：1）将深度上下文化词嵌入到词性标记器和解析器中；2）集合使用不同初始化的解析器进行训练。我们还探索了不同的合并树库的方法以进行进一步的改进。开发数据上的实验结果显示了我们方法的有效性。在最后的评估中，我们的系统在 LAS（75.84％）上排名第一，并大幅跑赢了其他系统。

Jul, 2018

82 个树库，34 个模型：多树库模型实现通用依存句法分析

介绍了 Uppsala 系统，它是一个由三个部分构成的流水线，可以用于 CoNLL 2018 共享任务的普遍依赖语法分析。通过使用多个树库对同一语言或密切相关语言训练模型，我们极大地减少了模型数量，最终在公开测试上获得了 LAS 和 MLAS 指标的第 7 位排名以及词分割、普遍 POS 标签和形态特征的最高分。

Sep, 2018

将推文解析为通用依存关系

本文介绍了用 Universal Dependencies 分析 Tweets 的问题，提出了扩展 UD 指南来覆盖 Tweets 中的特殊结构以及使用新的 Tweet Treebank v2 来解决标注中的歧义，并构建了一个可以将原始 Tweets 解析为 UD 的流水线系统。此外，作者还提出了一种新的方法来精简基于转换的解析器的集合，并在真实情况下验证了该方法的有效性。

Apr, 2018

75 种语言，1 个模型：通用依存关系的全球解析

UDify 是一个多语言多任务模型，可以准确预测 75 种语言中 124 个通用依赖树库的通用词性、形态特征、词形和依赖树，无需任何循环或语言特定组件，并且在跨语言注释方面对低资源语言起到关键作用，并且可以进行零 - shot 学习。

Apr, 2019

指向式高效组成句法分析

我们提出了一种新的成分分析模型，将分析问题转化为一系列指向任务，支持高效的自上而下编码和学习目标。实验表明，我们的方法在不使用预训练模型的情况下取得 92.78 F1 的结果，使用预训练 BERT，达到了 95.48 F1 和最先进的技术水平相当。此外，我们的方法也在多语种成分分析领域实现了最新的技术进展。

Jun, 2020