Oct, 2022

句法距离引导的局部自注意力机制

TL;DR本文提出了一种语法指导的本地化自注意力 Transformer,该方法允许直接从外部成分句法分析器中加入语法结构,禁止注意机制通过加权距离较远但语法正确的令牌而不是接近的令牌。实验结果显示,我们的模型可以在从小到大不同规模的机器翻译数据集上持续地提高翻译性能。