EMNLPOct, 2023

4 和 7 位标记的投射和非投射依赖树

TL;DR引入了一种将任何工程性依赖树表示为一系列 4 位标签(每个词一个标签)的用于解析的编码方法,其标签的位表示(1)是否为左或右从属关系,(2)是否为其父节点的最外层(左 / 右)从属关系,(3)是否具有左子节点,和(4)是否具有右子节点。在多个不同的树库上进行的实验结果表明,与以前表现最佳的序列标注编码方法相比,我们的 7 位编码方法在准确性上取得了显著的提升,并且扩展了覆盖范围,几乎达到全非工程性弧的 99.9% 的经验弧覆盖率。