Jun, 2021

利用单语数据不确定性的自训练采样在神经机器翻译中的应用

TL;DR本文提出了一种基于不确定性采样的自训练方法,通过选择最具信息价值的单一语言句子来补充平行数据,以提高NMT的性能,在大规模数据集上进行实验证明了这种方法的有效性,并表明该方法能够提高翻译质量和预测低频单词。