SIGIRMar, 2022

Multi-CPR: 一个用于篇章检索的多领域中文数据集

TL;DR本文介绍了一种新型的多领域中文数据集,用于特定领域的段落检索,并发现针对特定领域进行训练的检索模型可以明显提高性能,这表明了领域标注数据的必要性。