Dec, 2023

多领域文本分类的正则化条件对齐

TL;DR我们提出了一种称为正则化条件对齐 (RCA) 的方法,通过对领域和类别的联合分布进行对齐,来匹配相同类别中的特征并增强获取的特征的判别能力,同时还利用熵最小化和虚拟对抗训练来限制未标记数据的预测不确定性并增强模型的鲁棒性。在两个基准数据集上的实证结果表明,我们的RCA方法优于最先进的多领域文本分类技术。