ACLJan, 2024

文档级神经机器翻译的重要性感知数据增强

TL;DR提出了一种基于重要性感知数据增强算法的文档级神经机器翻译方法,通过估计隐藏状态和训练梯度的法线来增加训练数据,并在常用文档级神经机器翻译基准数据集上获得了显著优于强基线模型和其他数据增强方法的结果,包括句子级和文档级 BLEU。