May, 2023

MAUPQA:大规模自动生成的波兰问答数据集

TL;DR本文探讨了自动收集弱标签数据集的方法,并展示了它们对神经检索模型的性能的影响。通过本文,我们发布了 MAUPQA 数据集,其中包含接近 400,000 个波兰语问题-段落对,以及 HerBERT-QA 神经检索器。