Apr, 2023

多语言神经机器翻译的 Pareto 前沿

TL;DR本研究旨在探究在多语言神经机器翻译中,给定方向的泛化性能如何随着其采样比例的变化而改变。我们发现,当训练语料具有数据不平衡时,标量化会导致多任务折衷前沿偏离传统的 Pareto 前沿。最后,我们基于观察结果提出了双重幂律,用于预测 MNMT 中的独特性能折衷前沿,并将 MNMT 中的采样比例选择问题制定为基于双重幂律的优化问题,该方法在实验中表现优异。