May, 2020

MultiReQA:跨领域检索问答模型评估

TL;DR本文介绍了一个新的多领域检索问题回答(ReQA)评估套件 MultiReQA,使用两个监督性神经模型(基于精调的 BERT 和 USE-QA 模型)及一个信息检索基线 BM25 在基于句子的 QA 数据集上进行系统评估,结果表明,虽然存在覆盖所有领域的通用模型,但通常通过对特定领域训练来获得最佳性能。