SIGIRApr, 2022

面向开放检索问答的合成目标领域监督

TL;DR本研究针对新的神经通道检索方法加以探讨,发现在 COVID-19 的封闭和专业目标域中,SOTA 模型 Dense Passage Retriever 比标准 BM25 差距较大。通过用文本生成器来生成合成训练示例对其进行微调,使其在对外域数据处理中更具鲁棒性,效果有所提高。最终,BM25 与改进的 DPR 模型的集成产生了最佳结果,进一步推动了开放式检索 QA 的 SOTA,适用于多个出域测试集。