Oct, 2020

针对低资源语言的基于锚点的双语词嵌入

TL;DR提出了一种新的构建双语词向量嵌入的方法,该方法利用高资源源语言的向量空间作为训练低资源目标语言嵌入空间的起点,并通过使用源向量作为锚点,在训练过程中自动对齐向量空间,结果表明该方法不仅提高了双语词向量的质量和双语词汇词典归纳的性能,而且提高了目标语言的单语词相似性。