EMNLPSep, 2021

有预训练还是有标注数据?在有限预算条件下进行领域自适应

TL;DR本文主要研究了如何在有限预算的情况下,通过选取最佳的数据标注和预训练策略,优化 NLP 领域的域适应问题,研究表明,小预算情况下,全部资金用于数据标注可以获得最好的性能表现,但预算足够大时,则在数据标注和领域内预训练之间进行平衡会更好。