Feb, 2019

使用双向双编码器和加性边界 softmax 改进多语言句子嵌入

TL;DR本研究提出了一种使用双向双编码器和加性边际softmax学习多语言句子嵌入的方法,能够在联合国(UN)平行语料库检索任务上取得最先进的结果,并使用检索到的语言对训练NMT模型。通过对我们的句子嵌入平均构建的简单文档级别嵌入进行实验,能在UN文档级别检索任务中取得97%以上的P@1。最后,我们在BUCC挖掘任务上评估了所提出的模型,利用原始余弦相似度得分的学习嵌入与当前最先进的模型相比取得了有竞争力的结果,并利用第二阶段的评分器在此任务上实现了新的最先进水平。