EMNLPOct, 2020

神经机器翻译的 Token 级自适应训练

TL;DR本文研究了神经机器翻译中的令牌不平衡现象,并提出采用基于目标令牌频率的目标令牌级自适应目标来训练模型,以提高翻译质量和提高翻译词汇的多样性。结果表明,与基线相比,在包含更多低频词汇的句子中,分别可以获得 1.68,1.02 和 0.52 的 BLEU 增益。