多项式对抗网络用于多领域文本分类
本研究提出了一个名为 MRAN 的混合正则化对抗网络,通过引入领域和类别的混合正则化来增强共享潜在空间内在特征,并在训练实例之间强制执行一致的预测,以使学习到的特征更具领域内部不变性和区分性,实验结果表明对于 Amazon 评论数据集和 FDU-MTL 数据集分别获得了 87.64%和 89.0%的平均准确率,优于所有相关基线模型。
Jan, 2021
提出了第一个可以用单一模型生成多目标对抗样本的多目标对抗网络,并将其用于提高分类模型的鲁棒性。实验证明,该方法在多目标攻击和单目标攻击任务中的攻击效果强于现有最先进的对抗性攻击方法,并且在面对各种攻击方法时具有更好的分类准确性。
Aug, 2019
介绍了 Stochastic Adversarial Network (SAN),通过引入多元高斯分布模型领域特定特征提取器的参数,与传统的权重向量不同,可生成许多领域特定特征提取器而不增加模型参数,同时结合域标签平滑和健壮的伪标签正则化以提高对抗训练的稳定性和特征区分能力,在两个主要的多领域文本分类基准测试上表现出竞争优势。
May, 2024
本文提出了一种新颖的双对抗协同学习方法,用于多领域文本分类,该方法利用共享 - 私有网络进行特征提取,并在不同域和标签与未标签数据同时下采用双重对抗正则化来对齐特征,并旨在通过所学习的特征来提高分类器的泛化能力。我们在多领域情感分类数据集上进行了实验,结果表明所提出的方法达到了目前最先进的多领域文本分类性能。
Sep, 2019
本文提出了条件对抗网络 (CANs) 框架,旨在探索共享特征和标签预测之间的关系,以对共享特征施加更多的可辨识性,用于多领域文本分类 (MDTC)。CAN 引入了一个条件域鉴别器,同时对共享特征表示和类别感知信息建模,采用熵条件保证共享特征的可转移性。我们提供了 CAN 框架的理论分析,证明 CAN 的目标等价于最小化共享特征和标签预测的多个联合分布之间的总发散。因此,CAN 是一个理论上良好的对抗网络,其可以判别多个分布。在两个 MDTC 基准测试上的评估结果表明,CAN 优于之前的方法。进一步的实验表明,CAN 具有将学习到的知识推广到未见领域的良好能力。
Feb, 2021
多领域文本分类(MDTC)是利用相关领域的可用资源来提高目标领域的分类准确性。本研究提供了关于 MDTC 的理论分析,将其分解为多个领域适应任务,并以边缘差异作为领域差异的度量,建立了一个基于 Rademacher 复杂度的新的泛化界限,并提出了基于边缘差异的对抗训练(MDAT)方法以验证其有效性。实验证明,我们的 MDAT 方法在两个 MDTC 基准上超过了先前的方法。
Mar, 2024
本文提出了一种基于共正则化的对抗学习机制,用于多领域文本分类,通过构建两个不同的共享潜在空间,在其中进行每个 domain 的域对齐,并通过惩罚两个对齐在未标记数据上的预测不一致性来进行特征学习。同时,此方法还结合了虚拟对抗训练进行一致性正则化。实验表明该模型在两个 MDTC 基准测试上优于现有方法。
Jan, 2022
本文提出一种多重对抗领域自适应方法 (MADA),能够捕获多模态结构,利用多个领域判别器实现不同数据分布的精细对齐,利用随机梯度下降计算梯度,证据表明该模型在标准领域自适应数据集上优于现有最先进方法。
Sep, 2018
本文研究了利用预训练语言模型诱导的上下文嵌入空间中的对抗文本的嵌入发散现象,并提出了一种基于嵌入流形的文本防御机制,将文本嵌入映射到近似嵌入流形上进行分类,从而增强模型的鲁棒性。实验证明,该方法在不牺牲准确性的前提下,在各种攻击设置下始终显著优于以前的防御方法。
Nov, 2022