EMNLPMay, 2022

多语言神经机器翻译中的收敛性统一化

TL;DR本文介绍了一种名为 LSSD(Language-Specific Self-Distillation)的新型训练策略,该策略可以缓解不同语言对之间的收敛不一致性并帮助 MNMT 模型同时在每种语言对上取得最佳性能。实验结果表明,LSSD 可以显著提高所有语言对的翻译性能,达到了最先进水平。