ACLJul, 2021

神经机器翻译置信度感知的计划采样

TL;DR本文提出了基于置信度的定时采样策略,针对神经机器翻译中定时采样策略无法根据实时模型表现进行调整的问题,通过使用模型预测的置信度来量化实时模型表现,并设计了细粒度的采样策略。实验结果表明,该策略在 Transformer 模型上显著优于 Vanilla 定时采样,可以提高翻译质量和收敛速度。