Jul, 2024

一种新的分叉方法用于对强化学习智能体的观测扰动攻击:对网络化电力系统的负载修改攻击

TL;DR通过使用组别区别逻辑损失和分流层的新型攻击技术,可以在连续控制中显著增加攻击影响,并且所需的畸变要远小于最优目标攻击,从而使其更难被检测到。实验结果表明,对DRL控制器的对抗攻击会产生显著影响,同时限制攻击的扰动使其难以被检测,但某些DRL架构更具鲁棒性,并且鲁棒训练方法可以进一步减小攻击的影响。