用于欺骗无线网络中反应干扰器的强化学习

MMMar, 2021

用于欺骗无线网络中反应干扰器的强化学习

Reinforcement Learning for Deceiving Reactive Jammers in Wireless Networks

Ali Pourranjbar, Georges Kaddoum, Aidin Ferdowsi, Walid Saad

TL;DR本文提出了一种新颖的反干扰策略，基于诱骗干扰者攻击受害者通道的想法，在保持合法用户在安全通道中通信的同时欺骗干扰者。通过使用强化学习算法提出了最优信道选择方案和次优功率分配方式，并通过求解接收总功率（TRP）的统计下界来评估其性能。仿真结果表明，与已有的两种基于强化学习算法的反干扰技术和随机信道分配策略相比，该方法表现更优，能够获得接近最优的 TRP。

Abstract

Conventional anti-jamming method mostly rely on frequency hopping to hide or escape from jammer. These approaches are not efficient in terms of bandwidth usage and can also result in a high probability of jamming

anti-jamming frequency hopping channel selection reinforcement learning total received power

发现论文，激发创造

一种针对无线网络的协作多智能体强化学习抗干扰算法

本文研究多用户场景中的防干扰问题，提出了基于马尔可夫博弈模型的协作式多智能体抗干扰算法，能够有效解决干扰问题。模拟结果表明该算法优于传统方法，能够最大化性能指标。

Sep, 2018

使用深度强化学习的 QoS 和干扰感知无线网络

提出一种抵御干扰攻击的无线网络建模方案，通过干扰感知的路由协议和基于深度强化学习的分布式合作框架实现有效通讯以及网络安全防御，并优化吞吐量，能效，时延和安全指标。通过实验表明，提出的方案在对抗干扰攻击和实现优化吞吐量方面具有很好的鲁棒性和有效性。

Oct, 2019

强化学习用于减轻太赫兹通信网络中的间歇性干扰

本文提出了一种基于强化学习的新框架，使用自适应的多阈值策略来高效地检测和减轻时间域中方向链接的间歇性干扰的问题。

Mar, 2020

使用频谱瀑布的抗干扰通信：一种深度强化学习方法

本文提出了一种基于在线学习的反干扰通信方法，使用频谱瀑布直接处理原始信号，通过构建深度 Q 网络和强化学习算法得到最佳反干扰策略，从而避免了需要先估计干扰模式和参数的问题，结果表明该方法可以广泛应用于各种反干扰场景。

Oct, 2017

鲁棒网络切片：多智能体策略，对抗攻击和防御策略

该论文提出了一个在多个基站和多个用户的动态环境中实现网络切片的多智能体深度强化学习框架。通过模拟评估了所提出的深度强化学习算法的性能，然后设计了一种基于深度强化学习的干扰器，用于最小化网络切片实现的传输速率并降低网络切片代理的性能，最后提出一种纳什均衡监督策略集合混合策略配置来进行网络切片和干扰器的防御策略。

Nov, 2023

通过深度对抗神经网络架构和环境背散射增强通信来打败干扰器

本研究通过使用神经网络、环境背散射通信等技术，设计了一种新型的深度强化学习算法，实现了优秀的反制干扰效果，提高了平均吞吐量 426% 并减少了 24% 的数据包丢失率，可以应用于 URLLC 和军事场景。

Apr, 2019

基于深度强化学习的无人机辅助抗干扰蜂窝通信

本文提出了一种基于深度强化学习的无人机中继框架，旨在通过在动态博弈中使用以前的反干扰中继体验和观察到的当前网络状态来帮助移动用户抵御智能干扰，从而降低丢包率，提高能源利用效率。

May, 2018

深度学习用于发起和缓解无线干扰攻击

使用对抗机器学习对无线通信进行干扰攻击，通过深度学习分类器可靠预测下一个成功的传输并有效地干扰。开发了生成对抗网络以减少获取训练数据集的时间。作为一种防御方案，传输机故意采取一些错误的动作来干扰干扰器的可靠分类器，从而增加其吞吐量。

Jul, 2018

多个无人机的鲁棒路径规划：基于深度强化学习

本研究旨在针对移动干扰器存在的情况下，寻找多个航空无人机与地面基站的连通性且避开碰撞的路径。我们提出了一种利用离线时间差异学习算法和在线信噪比映射解决该问题的方案。结果表明，在没有干扰器信息的情况下，我们提出的算法可以高效地避免碰撞并实现实时的多无人机导航任务。

Apr, 2021

基于多智能体深度强化学习的无线网络资源管理

本文提出了使用多智能体深度强化学习机制的分布式资源管理和干扰抑制方案。该框架通过使智能体作出决策，从而解决了干扰和资源分配的问题。模拟结果表明，这种方法具有比分散式基线更高的性能，在与集中式信息论基线相媲美的同时，模型的鲁棒性得到了验证。

Feb, 2020