BriefGPT.xyz
大模型
Ask
alpha
关键词
neuron explanation methods
搜索结果 - 1
深度视觉特征的神经元解释破坏
通过统一的流程对神经元解释方法进行了首次的鲁棒性分析,揭示在探测数据中添加随机噪声和设计良好的干扰可以显著破坏这些解释,引发对神经元解释方法在现实应用中的安全和公平性的关切。
PDF
8 months ago
Prev
Next