ACLApr, 2021

标注器无法学习的,解析器最需要的

TL;DR通过错误分析神经 UPOS 标签器,我们评估了为什么使用黄金标准标签对于解析性能有很大的积极贡献,而使用预测的 UPOS 标签要么损害性能,要么提供微不足道的改进。我们评估了神经依赖分析器隐含地学习了哪些单词类型,以及这与标记器产生的错误有何关系,以解释使用预测标签对解析器几乎没有影响的原因。同时,我们还对导致标记性能降低的上下文进行了简短分析,然后基于标记器的错误屏蔽了 UPOS 标签,以分离标记器正确分类和错误分类的 UPOS 标签的贡献以及标记错误的影响。