Dec, 2019

利用连续注意力模型实现鲁棒性图像分类

TL;DR本文提出了一种受人类感知启发的注意力模型,并将其融合到现代神经网络架构中。实验结果表明,引入注意力机制可以显著提高模型的对抗鲁棒性,在各种随机攻击强度下可以达到最先进的 ImageNet 准确度;通过控制注意力步骤的数量可以使模型的防御能力更强,并且可以对抗更强的攻击;攻击模型生成的对抗样本有着与传统对抗样本不同的全局、显著和空间一致的结构,这些结构来自目标类别并且甚至可以被人类识别,会使模型注意力从原始图像中的主要物体分散开来。