多域文本分类的Co正则化对抗学习
本文提出一种多项式对抗网络(MAN)用于处理多域文本分类问题(MDTC), MAN学习在多个域上保持不变的特征,并通过减少每个域特征分布之间的差异来实现。MAN在实验中取得了显著的性能提升,并且在无标签数据的域中达到了最先进的性能水平。
Feb, 2018
本文提出了一种基于结构化神经模型与领域特定和领域通用组件的联合学习以及领域对抗训练的方法,以优化域内和域外准确性,本方法在多领域语言识别和情感分析领域中的表现都优于标准领域适应技术和领域对抗培训。
May, 2018
本文提出了一种新颖的双对抗协同学习方法,用于多领域文本分类,该方法利用共享-私有网络进行特征提取,并在不同域和标签与未标签数据同时下采用双重对抗正则化来对齐特征,并旨在通过所学习的特征来提高分类器的泛化能力。我们在多领域情感分类数据集上进行了实验,结果表明所提出的方法达到了目前最先进的多领域文本分类性能。
Sep, 2019
本研究提出了一个名为MRAN的混合正则化对抗网络,通过引入领域和类别的混合正则化来增强共享潜在空间内在特征,并在训练实例之间强制执行一致的预测,以使学习到的特征更具领域内部不变性和区分性,实验结果表明对于Amazon评论数据集和FDU-MTL数据集分别获得了87.64%和89.0%的平均准确率,优于所有相关基线模型。
Jan, 2021
本文提出了条件对抗网络 (CANs) 框架,旨在探索共享特征和标签预测之间的关系,以对共享特征施加更多的可辨识性,用于多领域文本分类 (MDTC)。CAN引入了一个条件域鉴别器,同时对共享特征表示和类别感知信息建模,采用熵条件保证共享特征的可转移性。我们提供了CAN框架的理论分析,证明CAN的目标等价于最小化共享特征和标签预测的多个联合分布之间的总发散。因此,CAN是一个理论上良好的对抗网络,其可以判别多个分布。在两个MDTC基准测试上的评估结果表明,CAN优于之前的方法。进一步的实验表明,CAN具有将学习到的知识推广到未见领域的良好能力。
Feb, 2021
该研究探讨了最大批次 Frobenius 范数方法提高多领域文本分类的特征可辨识度,并在两个基准测试中展示了其成功地提升了最先进技术的表现。
Jan, 2022
本文提出了一种基于关键词权重排序的课程学习策略来改善多域文本分类模型的性能,该方法在对抗训练的基础上,并且在Amazon评论和FDU-MTL数据集上的实验结果表明,它能有效地提高多领域文本分类模型的性能,并优于现有的方法。
Oct, 2022
我们提出了一种称为正则化条件对齐 (RCA) 的方法,通过对领域和类别的联合分布进行对齐,来匹配相同类别中的特征并增强获取的特征的判别能力,同时还利用熵最小化和虚拟对抗训练来限制未标记数据的预测不确定性并增强模型的鲁棒性。在两个基准数据集上的实证结果表明,我们的RCA方法优于最先进的多领域文本分类技术。
Dec, 2023
多领域文本分类(MDTC)是利用相关领域的可用资源来提高目标领域的分类准确性。本研究提供了关于MDTC的理论分析,将其分解为多个领域适应任务,并以边缘差异作为领域差异的度量,建立了一个基于Rademacher复杂度的新的泛化界限,并提出了基于边缘差异的对抗训练(MDAT)方法以验证其有效性。实验证明,我们的MDAT方法在两个MDTC基准上超过了先前的方法。
Mar, 2024
介绍了Stochastic Adversarial Network (SAN),通过引入多元高斯分布模型领域特定特征提取器的参数,与传统的权重向量不同,可生成许多领域特定特征提取器而不增加模型参数,同时结合域标签平滑和健壮的伪标签正则化以提高对抗训练的稳定性和特征区分能力,在两个主要的多领域文本分类基准测试上表现出竞争优势。
May, 2024