ACLApr, 2019

使用相似度度量选择 NER 的预训练数据

TL;DR本文提出了三种低成本的方法来衡量源预训练和目标任务数据之间的相似性,并在超过 30 个数据对上展示这些方法是好的预测器。结果表明,预训练的语言模型比预训练的词向量更有效,更可预测,但是预训练的词向量在预训练数据不相似时表现更好。