EMNLPAug, 2021

Mr. TyDi: 为密集检索提供多语言评测基准

TL;DR介绍了 Mr.TyDi - 一个包括 11 种不同语言、多语言检索基准数据集,旨在评估利用学习的密集表示进行排名的效果。通过提供多语言 DPR 等基线模型,实验结果表明,虽然效果比 BM25 模型要差,但密集表示仍然可以提供有价值的相关信号,可以用于在稀疏和密集模型之间建立混合模型,具有进一步的研究意义。