ACLJun, 2019

通过自编码学习双语句子嵌入并使用多层感知器计算相似度

TL;DR本文提出一种新型模型架构及培训算法,可从平行和单语数据的组合中学习双语句子嵌入。我们通过自编码和神经机器翻译将源语言和目标语言的句子嵌入连接起来。并通过多层感知机来提取非平行或有噪声的双语句对,此方法在句子对齐和 WMT2018 上表现出有希望的性能。