ACLDec, 2020

通过最优传输进行的词汇学习,用于神经机器翻译

TL;DR本研究旨在找出好的词汇,并确定在不需要试验训练的情况下,是否可以找到最优词汇。我们提出了一种新的信息理论视角解释词汇的作用,并将词汇化的目标 —— 找到大小适当的最佳词汇字典 —— 表述为一种最优搬运(OT)问题。我们提出了一个名为 VOLT 的简单高效的解决方案,实证结果表明,在涵盖 WMT-14 英德和 TED 的 52 个翻译方向等各种情况下,VOLT 的表现优于广泛使用的词汇集,例如,在英德翻译中,VOLT 实现了近 70% 的词汇量减少和 0.5 BLEU 增益。此外,与 BPE-search 相比,VOLT 将英德翻译的搜索时间从 384 GPU 小时减少到 30 GPU 小时。