May, 2023
多语言翻译的像素表达和数据效率跨语言迁移
Pixel Representations for Multilingual Translation and Data-efficient Cross-lingual Transfer
Elizabeth Salesky, Neha Verma, Philipp Koehn, Matt Post
TL;DR使用像素表示方法来训练多语言机器翻译模型,实现了与子字嵌入相媲美的性能,并发现像素表示具有无缝跨语言迁移和比扩展词汇等替代方法更高的数据效率