BriefGPT.xyz
Ask
alpha
关键词
non-robust features
搜索结果 - 3
对抗样本不是真实特征
对抗性示例的存在多年来一直是一个谜团,吸引了广泛的兴趣。本文从一个更大的背景视角重新审视这个理论,发现非鲁棒特征不像人类视为噪声特征那样有用,而具有良好转移性的鲁棒或自然特征更加有用。同时,我们还展示了经过鲁棒特征培训的编码器在 AutoA
→
PDF
8 months ago
通过信息瓶颈改善自然语言处理模型对抗攻击鲁棒性
本文利用信息瓶颈理论,研究消除易受攻击的非鲁棒特征,提取任务特定的鲁棒特征。通过大量实验证明,我们的方法可在 SST-2、AGNEWS 和 IMDB 数据集上除了几乎不受性能下降的情况下,在鲁棒准确度上实现显著提高,超过以往任何被报道的方法
→
PDF
2 years ago
对抗性样本不是错误,它们是特征
本研究通过理论模型和实验数据,证明了对抗样本的普遍存在是由于数据分布中存在易碎且难以理解的非鲁棒特征的存在,进而解释了目前算法鲁棒性需要的人类专家知识与数据自身特性之间的不匹配性问题。
PDF
5 years ago
Prev
Next