多任务学习中的隐藏任务的对抗攻击

May, 2024

Adversarial Attacks on Hidden Tasks in Multi-Task Learning

Yu Zhe, Rei Nagaike, Daiki Nishiyama, Kazuto Fukuchi, Jun Sakuma

TL;DR该研究论文调查了针对多任务分类器中隐藏任务的攻击的可行性，提出了一种新颖的敌对攻击方法，利用非目标任务的知识和多任务模型的共享主干网络迫使模型遗忘与目标任务相关的知识，实验证明了该方法在削弱隐藏任务的准确性方面的有效性，并且保留了可见任务的性能，有助于了解多任务分类器中的敌对性漏洞。

Abstract

deep learning models are susceptible to adversarial attacks, where slight perturbations to input data lead to misclassification. adversarial atta

发现论文，激发创造

深度网络在计算机视觉方面的准确性很高，但仍然容易受到对抗性攻击。本文理论和实验分析表明，训练模型的对抗鲁棒性与其训练任务的数量有关，多任务训练可以提高模型对单个任务的对抗攻击鲁棒性。尽管对抗防御仍是一个挑战，但本研究表明深度网络之所以容易受攻击，部分原因是它们只是在少数任务上进行了训练。

Jul, 2020

本文提出了一个基于对抗学习的多任务学习框架，在 16 个文本分类任务上的实验结果表明了该方法的优势，并证明了模型学习到的共享知识可以作为现成的知识轻松迁移到新的任务中。

Apr, 2017

深度神经网络被广泛用于各种下游任务，尤其是自动驾驶等安全关键场景，但深度网络常常受到对抗样本的威胁。对抗攻击可以分为白盒攻击和黑盒攻击，前者攻击者知道模型的参数和梯度，后者攻击者只能获取模型的输入和输出。攻击者的目的可以分为有目标攻击和非有目标攻击，黑盒设置是我们实践中会遇到的情况。

Aug, 2023

本文提出了一种自适应攻击（Adaptive Attack）的方法，利用每个任务的不确定性，直接学习自适应多任务的加权方法，以加速来自序列学习任务的对抗攻击方法，并获得了很好的成功率和速度提升，实现了针对场景文本识别的对抗攻击。

Jul, 2018

本文针对自主驾驶感知任务中的多任务视觉感知深度网络，进行了细致的对抗攻击研究，并提出了简单的防御方法。实验考虑了针对性和非针对性的白盒和黑盒攻击，以及在攻击一个任务时检查对其他任务的影响，同时还检查了应用简单防御方法的效果。最后通过对实验结果进行比较和讨论，提出了一些结论和未来研究方向。

Jul, 2021

本文研究多任务学习中的单任务机器学习攻击，提出了基于平均相对损失变化的动态梯度平衡攻击方法（DGBA），并在两个流行的多任务学习基准测试库上进行了广泛评估。结果显示参数共享会提高任务准确性，但对提高模型健壮性有贡献。

May, 2023

文章讨论了不同类型的威胁模型下的敌对攻击，以及近期对抗这些攻击的有效方法和挑战，以提高深度学习算法的鲁棒性。

Sep, 2018

研究多标签学习模型的脆弱性和准确性，提出通用的攻击框架来攻击深度神经网络，并设计两个特定方法来生成有针对性的多标签扰动来检测模型的脆弱性，并提出了一种潜在的防御策略来增强多标签深度学习模型的可解释性和鲁棒性。

Jan, 2019

通过使用元梯度将图形视为超参数进行优化，我们研究了对节点分类的图神经网络进行训练时间攻击，发现即使对无监督嵌入也会出现性能下降，甚至会产生误导效应。

Feb, 2019

本研究提出了一个名为 MTAA 的多任务学习框架，可以同时识别攻击算法、受害模型和超参数三个签名，并使用不确定性加权损失来调整权重，从而提高该框架对于误报的处理能力。

Feb, 2023