EMNLPSep, 2019

神经机器翻译的数据排序模式:实证研究

TL;DR本文通过实证研究不同训练数据排序方法对神经机器翻译模型性能的影响,结果表明基于预训练模型的困惑度得分对训练数据进行预排序的方法表现最佳,在每轮训练中优于默认方法随机洗牌训练数据。