Jul, 2022

神经网络的自动修复

TL;DR提出了一种通过使用SMT求解器修复有关安全规范的不安全神经网络,以防止对抗攻击,并且通过修改少量的权重值来寻找新的安全神经网络表示,从而最大限度地保持决策边界相似性,同时保证只有轻微的准确度损失,证明了该方法的实用性。