May, 2023

多语言翻译的像素表达和数据效率跨语言迁移

TL;DR使用像素表示方法来训练多语言机器翻译模型,实现了与子字嵌入相媲美的性能,并发现像素表示具有无缝跨语言迁移和比扩展词汇等替代方法更高的数据效率