Mar, 2024

基于边缘差异的域间文本分类对抗训练

TL;DR多领域文本分类(MDTC)是利用相关领域的可用资源来提高目标领域的分类准确性。本研究提供了关于 MDTC 的理论分析,将其分解为多个领域适应任务,并以边缘差异作为领域差异的度量,建立了一个基于 Rademacher 复杂度的新的泛化界限,并提出了基于边缘差异的对抗训练(MDAT)方法以验证其有效性。实验证明,我们的 MDAT 方法在两个 MDTC 基准上超过了先前的方法。