Dec, 2022

P-Transformer:面向更好的文档到文档神经机器翻译

TL;DR本文提出了一个使用位置感知 Transformer 的 Doc2Doc NMT 模型,通过整合绝对位置信息和相对位置信息,显著改善了传统 Transformer 在数据集小且层数较高时不能训练成功的问题,并在多个语言对的文档级翻译实验中取得了新的最高性能。