Sep, 2024

上下文是关键:利用视觉变换器进行上下文学习的后门攻击

TL;DR本研究针对使用不可信来源下载的预训练大型模型面临的安全问题,提出了一种基于视觉变换器(ViTs)的后门攻击方法。研究发现,攻击者可以通过任务特定和泛化的后门攻击,导致目标任务在存在触发器时被破坏,且其他任务不受影响,最大降解率达到89.90%。进一步的分析显示,现有的去后门方法效果有限,最低降解仅降低至73.46%。