ACLMay, 2023

随机选择 BPE 合并操作时有哪些变化?不多

TL;DR通过引入三种简单的随机字节对编码变体并探索选择合并操作的随机化是否显著影响下游机器翻译任务,我们的研究旨在翻译形态丰富的语言,使用贝叶斯线性模型分析表明,两种变体与标准 BPE 几乎没有区别,而另一种变体的性能降低小于预期。我们得出结论,虽然标准 BPE 被广泛使用,但存在一个值得研究的有趣方案的可能性变体宇宙。