EMNLPApr, 2020

SimAlign: 使用静态和上下文嵌入实现高质量的单词对齐,无需并行训练数据

TL;DR本文提出了一种无需平行数据就能进行词对齐的方法,基于多语言词嵌入,可以用于统计和神经机器翻译以及跨语言注释投影等任务。结果表明,使用词嵌入创建的对齐效果比传统统计对齐器效果更好,即使是在有丰富的平行语料的情况下。