Dec, 2023

金丝雀与哨声:具有或不具有深度强化学习的弹性无人机通信网络

TL;DR在本研究中,我们考虑了一种具有挑战性的情境,其中无人机在供应链的制造过程中受到了损害,并携带着能够广泛传播和带来破坏的恶意软件。我们通过研究多智能体深度强化学习作为一种学习防御策略、最大化通信带宽的工具,来解决这一问题。通过使用一个公共挑战任务来学习网络韧性策略,我们提出了一种先进的专家技术,并研究了其相对于深度强化学习智能体的优越性。相应地,我们确定了三种改进学习智能体性能的具体方法:(1)保证每个观测包含必要的信息,(2)使用专家智能体为学习提供课程,(3)密切关注奖励。我们应用了这些方法,并提出了一种新的混合策略,使专家智能体和学习智能体能够共同合作,并在所有先前结果的基础上取得改进。