AAAIApr, 2020

预训练神经机器翻译模型的强化课程学习

TL;DR本文针对神经机器翻译中如何最佳利用具有多样性质和不同质量级别的数据样本提出了数据选择框架,通过筛选对模型性能有重要影响的样本来改进已经预先训练过的模型。实验表明,所提出的基于确定性演员 - 评论家 (Deterministic Actor-Critic) 的数据选择方法能够在不增加新的训练数据的情况下显著提高翻译质量,并大幅优于其他强基线方法。