Dec, 2022

神经机器翻译的合成预训练任务

TL;DR本研究旨在探讨何种情况下用合成资源进行预训练是有效的。我们将神经机器翻译作为情景背景,研究使用两种新方法进行翻译模型预训练的影响,并在多种语言对上进行实证评估,结果表明预训练的好处即使在混淆或纯合成数据的情况下也可以实现,并研究混淆和合成预训练技术能够减轻虚假模型毒性的程度。