Jun, 2024

深度状态空间模型的对抗鲁棒性探索

TL;DR深度状态空间模型(SSMs)面临着真实世界部署中的对抗性扰动(APs)所带来的严重安全挑战。本研究评估了 SSMs 的不同结构变种在对抗训练(AT)中的对抗鲁棒性(AR)表现,并发现引入注意力机制对于 SSMs 在 AT 中具有更好的稳健性和泛化性之间的权衡,并提出了一种简单而有效的自适应缩放(AdS)机制以解决引入 RO 问题的困境。