Oct, 2023

深度视觉特征的神经元解释破坏

TL;DR通过统一的流程对神经元解释方法进行了首次的鲁棒性分析,揭示在探测数据中添加随机噪声和设计良好的干扰可以显著破坏这些解释,引发对神经元解释方法在现实应用中的安全和公平性的关切。