Jun, 2021

DocNLI: 一个大规模的文档级自然语言推理数据集

TL;DR介绍了DocNLI数据集,它是基于广泛的NLP问题构建的,涵盖了文本的多种类型和文档层级上的NLI,而不是仅仅句子层级上的。实验表明,即使没有微调,预训练于DocNLI上的模型在流行的句子级基准测试中表现良好,并且推理到文档层级上的跨域NLP任务具有良好的泛化性能。