Aug, 2024

通过不确定性估计检测语义分割中的对抗攻击:深入分析

TL;DR本研究针对深度神经网络在语义分割任务中易受对抗攻击的脆弱性进行了深入探讨,提出了一种基于不确定性的方法来检测这些攻击。研究发现,清晰图像与受扰图像在输出分布的不确定性(熵)上表现出显著差异,利用这一特性,提出的检测方法可有效识别对抗样本,且无需对模型进行修改或了解攻击生成过程。