Michalina Strzyz, David Vilares, Carlos Gómez-Rodríguez
TL;DR本文提出一种基于括号的编码方法来表示依存句法树,通过利用 2-planarity 的特性进行编码以实现对非投影树的几乎完全覆盖,并在高度非投影树库上提高 0.4% LAS 的准确性。
Abstract
We present a bracketing-based encoding that can be used to represent any
2-planar dependency tree over a sentence of length n as a sequence of n labels,
hence providing almost total coverage of crossing arcs in sequence labeling
parsing. First, we show that existing bracketing encoding
通过深度神经网络处理输入进一步编码为潜在变量,包括在序列中使用连续潜在变量对输入进行编码的局部自编码分析器(LAP)和在依存树中使用依赖树作为潜在变量对输入进行编码的全局自编码分析器(GAP),使用统一结构和不同的损失函数处理有标记和无标记的数据,并在 WSJ 和 UD 依存解析数据集上进行实验,展示模型能够利用未标记的数据来提高性能,并超越以前提出的半监督模型。