Mar, 2024

低资源机器翻译的指针生成网络:不要复制!

TL;DR在低资源机器翻译中,通过 Transformer 网络结构的结构性快捷方式,如从源语言复制子词到目标语言,可以为近缘语言对之间的机器翻译提供微弱的改进,但并不展现与远缘语言对或低资源范围下相似语言对之间更强的改进,并且模型对于共享子词的机制使用并不如预期,这突显了低资源机器翻译领域面临的诸多挑战,如现代分词策略、嘈杂的真实环境和语言复杂性,并呼吁对 Transformer 模型进行更好的语言学动机改进的审视及对该领域上述问题的关注。