MMMar, 2021

用于欺骗无线网络中反应干扰器的强化学习

TL;DR本文提出了一种新颖的反干扰策略,基于诱骗干扰者攻击受害者通道的想法,在保持合法用户在安全通道中通信的同时欺骗干扰者。通过使用强化学习算法提出了最优信道选择方案和次优功率分配方式,并通过求解接收总功率(TRP)的统计下界来评估其性能。仿真结果表明,与已有的两种基于强化学习算法的反干扰技术和随机信道分配策略相比,该方法表现更优,能够获得接近最优的 TRP。