Jan, 2022

应对新兴领域开放检索式问答系统中的跨语言性问题

TL;DR本文提出了一种跨语言的开放检索问答系统,使用科学文章语料库保证检索到的文档的可靠性;通过利用自动翻译、对齐和过滤来产生英文 - 全语言数据集,缓解新兴语境下跨语言训练数据的稀缺性。结果表明,在使用我们的英文 - 全语言数据进行训练后,深度语义检索器在跨语言设置中明显优于 BM25 基线。