EMNLPAug, 2018

神经机器翻译的强化学习研究

TL;DR本文进行了一项系统性研究,比较了训练 NMT 模型的几个重要因素(例如基线奖励,奖励塑造)在强化学习中的作用,并提出了一种新的方法来利用强化学习进一步提高用单语数据训练的 NMT 系统的性能,融合了所有发现,取得了 WMT17 中英翻译任务的最高性能。