May, 2024

多任务学习中的隐藏任务的对抗攻击

TL;DR该研究论文调查了针对多任务分类器中隐藏任务的攻击的可行性,提出了一种新颖的敌对攻击方法,利用非目标任务的知识和多任务模型的共享主干网络迫使模型遗忘与目标任务相关的知识,实验证明了该方法在削弱隐藏任务的准确性方面的有效性,并且保留了可见任务的性能,有助于了解多任务分类器中的敌对性漏洞。