Sep, 2023

对齐目标对语码转换翻译的影响

TL;DR我们提出了一种训练单一机器翻译模型的方法,该模型能够将单语句从一种语言翻译成另一种语言,并能够翻译混合语句到任意一种语言,以应对社交媒体和用户生成内容的崛起带来的语种切换翻译需求。该模型可被视为与人类类似的双语模型,并通过生成合成的混合语数据以及对编码器进行对齐损失来更好地使用并行数据。在使用 WMT14 英法数据集进行训练后,所训练的模型在混合语翻译中大幅优于双向基线模型,并且在非混合语(单语)数据上保持了质量。