Jun, 2019

弱监督开放域问答的潜在检索

TL;DR本文提出了一种新的open domain question answering方法, 利用问题-回答对来同时学习retriever和reader,将Wikipedia中的证据检索视为潜在变量,并通过Inverse Cloze Task进行预训练。我们的方法在五个QA数据集上进行测试,表明在用户真正寻求答案的数据集上,学习检索至关重要,完全匹配方面的得分比传统的IR系统(如BM25)高达19个点。