May, 2024

DALLMi: 基于 LLM 的多标签分类器的领域自适应

TL;DRDALLMi 是一种基于 BERT 的半监督领域适应方法,通过利用 BERT 词嵌入的插值,结合有限的正标记和大量无标记的文本,使用新颖的变分损失和 MixUp 正则化进行域适应学习,以及引入标签平衡采样策略来克服有标记和无标记数据之间的不平衡。在三个数据集上,DALLMi 的平均准确率(mAP)比无监督和部分监督方法分别高出 19.9% 和 52.2%。