Apr, 2021

BEIR: 一个用于零样本评估信息检索模型的异构基准

TL;DRBEIR(Benchmarking-IR)是一个针对信息检索的鲁棒性和异质性评估基准,通过对 18 个公开数据集的评估,发现 BM25 是一个强大的基线,而后期交互和重新排名模型通常可以实现最佳零 - shot 表现,但计算代价高,与此相反,密集和稀疏检索模型的计算效率更高,但往往表现得不如其他方法,突显了它们的可扩展性有很大的改进空间。