ICLROct, 2018

对抗性样本的代价敏感强健性

TL;DR本文研究了在实际应用中,某些对抗变换的重要性可能比其他变换更高的情况下,如何衡量分类器在对抗干扰下的鲁棒性,并提出了一般性的目标函数,将 Wong 和 Kolter(2018)的鲁棒训练方法进行了改进。通过实验证明,所提出的方法可以显著降低成本敏感鲁棒错误,同时保持分类准确性。