Apr, 2021

何时进行预训练有用?评估自监督学习在法律和 CaseHOLD 数据集上的表现

TL;DR本文介绍了一个新的 NLP 数据集 CaseHOLD,用于测试法律方面的 NLP 任务,同时指出在某些特定的领域语料的预训练条件下,Transformer-based architectures 的性能可能比一般的预训练模型更优秀,我们的发现有助于指导研究人员何时需要进行域预训练。