Oct, 2023

直接神经机器翻译模型及任务级混合专家

TL;DR通过对 Task-level MoE 在直接 NMT 中的适用性进行研究,我们提出了一系列高性能的训练和评估配置,通过这些配置,基于 Task-level MoE 的直接 NMT 系统在大多数低资源和高资源的直接语言对和翻译方向上优于双语和基于中间语言的模型。