ACLMay, 2020

无监督机器翻译数据增强改善跨语言词向量结构相似度

TL;DR提出了一种使用非监督机器翻译生成的伪平行语料库以优化跨语言词嵌入的无监督映射方法的新思路,改进了现有方法,并通过详细分析证明伪数据增强方法特别适用于基于映射的跨语言词嵌入任务。