ACLOct, 2021

CCQA:用于模型预训练的新型 Web 规模问答数据集

TL;DR本文提出一种在 Common Crawl 项目的基础上,使用大规模、自然、多样化问答数据集进行领域内预训练的方法,该方法可以用于 open-domain question-answering 任务中的零样本、低资源和微调设置,展示了预训练在该任务中的潜力。