May, 2023

基于阶段训练的无标签多领域机器翻译

TL;DR本篇论文提出一种无需领域注释数据的多领域机器翻译模型,包括骨干模型、领域鉴别器和一组专家。通过阶段式训练策略并结合聚类和多分类任务建模领域差异以及采用 Gumbel-Max 采样进行专家训练,该模型在德语到英语翻译任务中取得了较好的效果。