Apr, 2023

自监督蒸馏的两阶段跨领域文本分类框架

TL;DR本文提出了一种二阶段跨域文本分类的框架,使用掩蔽语言模型和标记数据从源域进行模型微调,然后使用自监督蒸馏和目标域的无标注数据进一步微调模型,实验结果表明我们的方法在单源域(94.17% ↑1.03%)和多源域(95.09% ↑1.34%)适应都达到了最新的最先进水平。