ICLROct, 2021

评估透过迁移学习所学习的神经网络的鲁棒性

TL;DR本文从威胁分析视角出发,对基于转导学习的防御机制进行了系统评估,并提出了攻击模型空间的原则,通过这一原则设计的攻击框架 Greedy Model Space Attack 可以作为评估转导学习防御机制的新基准。同时,本文发现在考虑的攻击方式下,重新训练模型可以显著提高对抗攻击的鲁棒性。