Oct, 2020

数据复兴:利用不活跃的训练样例进行神经机器翻译

TL;DR本文介绍了一种利用数据焕发来提高神经机器翻译模型在大规模数据集上的训练效果的方法,该方法需要通过训练一个识别模型,识别出不活跃的数据样本,然后使用一个焕发模型,对样本进行重新标记,最后将焕发后的样本和活跃样本组合来训练最终的神经机器翻译模型,实验结果表明该方法可以显著提高模型表现,特别是在大数据集上。