ACLJul, 2023

基于词汇转换和标签注入的无监督领域自适应 —— 以推特数据为例

TL;DR通过简单的词汇转换来减少源域数据集与目标域数据集之间的领域转变,使得模型在变换后的源域数据集上表现明显优于零样本模型,在转换为推特的英文上达到了 92.14% 的无监督词性标注准确率,仅略低于 94.45% 的监督效果,同时利用提出的转换方法来合成推特并增强推特数据集的表现达到了最先进的词性标注性能。