COLINGOct, 2022

神经机器翻译中大动作空间的强化学习

TL;DR通过减少词汇量和有效减少行动空间,以提高强化学习在神经机器翻译中的表现,取得了显著的 BLEU 分数改善,即平均 1.5 分。