EMNLPOct, 2016
通过字节对编码学习相关语言之间的可变长度单位
Learning variable length units for SMT between related languages via Byte Pair Encoding
Anoop Kunchukuttan, Pushpak Bhattacharyya
TL;DR本文研究了使用字节对编码(称为 BPE units)以及拼音音节作为翻译任务基本单元的效果, 结果表明,BPE units 作为翻译单元略优于拼音音节单元, 并且更适用于非元音书写系统的语言。