Dec, 2021

无监督学习检索文章段落

TL;DR本文介绍了一种基于无监督预训练的 ODQA 方法,通过 recurrent span retrieval 从文档中创建伪例子进行对比学习,控制 pseudo 查询和相关段落之间的术语重叠,从而允许模拟它们之间的词汇和语义关系,得到命名为“Spider”的模型,具有出色的性能,且不需要任何有标签的训练数据。