Apr, 2020

研究基于预训练 Transformer 语言模型的表征在标记文本数据的主动学习中的有效性

TL;DR本文全面评估了基于预训练变压器语言模型的表示法在主动学习中的有效性,发现 BERT 般的模型比 word2vec 和包 - of-words 等更常见的表示法表现更好,同时提出了一种自适应调整主动学习方法,利用有限的标签信息训练分类器和适应性改进 BERT 模型生成的嵌入。