拥挤频谱环境下雷达检测和跟踪的深度强化学习控制

MMJun, 2020

拥挤频谱环境下雷达检测和跟踪的深度强化学习控制

Deep Reinforcement Learning Control for Radar Detection and Tracking in Congested Spectral Environments

Charles E. Thornton, Mark A. Kozy, R. Michael Buehrer, Anthony F. Martone, Kelly D. Sherbondy

TL;DR本文采用深度强化学习（Deep RL）中的非线性价值函数逼近来实现智能脉冲雷达和相邻通信系统的动态非合作共存，并通过学习调整频率和中心频率，最大化雷达探测性能，保持对频带的充分利用。我们通过实验证明，与策略迭代或感知和避免（SAA）方法相比，基于 Deep Q-Learning（DQL）算法的方法更有效地提高雷达的重要性能度量，包括 SINR 和带宽利用率，同时维持良好的距离分辨率。我们还将 DQL 方法扩展到包括 Double Q-Learning 和递归神经网络，形成 Double Deep Recurrent Q-Network（DDRQN）。最后，我们用软件定义雷达（SDRadar）原型系统的实验结果证明了本文提出的深度强化学习方法在拥挤频谱环境下显著提高了雷达探测性能。

Abstract

In this paper, dynamic non-cooperative coexistence between a cognitive pulsed radar and a nearby communications system is addressed by app

deep rl radar communications coexistence frequency modulation

发现论文，激发创造

分布式和非协同认知无线电资源分配的深度强化学习

本文提出了一种分布式的深度强化学习资源分配技术，针对协作无线电网络所呈现的多智能体环境及其强化学习过程中可能导致的非平稳环境，通过考虑深度强化学习的特定方面，本文的算法能够迭代地收敛于一个平衡政策，其可用于无需与其他代理协调配合的情况下工作。仿真结果表明，与等效的基于 Q 表的 Q 学习算法相比，所提出的技术具有更快的学习性能，并能够在足够长的学习时间内在 99% 的情况下找到最优策略。此外，对于与等效的基于表格的实现相比，仿真结果显示出我们的 DQL 方法只需要不到一半的学习步骤才能实现相同的性能。此外，证明了在未协调交互的多无线电情景中使用标准的单智能体深度强化学习方法可能无法收敛。

May, 2022

分布式非协调认知无线电资源分配的深度强化学习

本文提出了一种基于深度强化学习的分布式资源分配技术，用于多代理环境下的认知无线电网络，该网络通过干扰下动态频谱访问与主干网络共存。该技术是分布式的，且不需要与其他代理协调，通过模拟结果可以显示出，该技术能够在有限的学习时间内，找到使性能在 3％之内的策略。

Oct, 2019

LTE 和 NR 的动态频谱共享的深度强化学习

本文提出一种新型的动态频谱共享方案，并使用深度强化学习算法基于蒙特卡罗树搜索进行资源分配，该方案能够在考虑未来网络状态的情况下执行操作，比当前的其他方案表现更好。

Feb, 2021

多业务网络中基于 QoS 限制的资源分配的深度强化学习

本文旨在研究一种利用强化学习算法在无线多业务系统中处理无线电资源分配问题的方法，通过在本地环境中与局部互动来寻找策略，实现了关于 9LTE 系统满足保证和 QoS 约束的无线资源分配。此外，通过计算模拟，本文与文献中的最新解决方案进行比较，并展示了后者在吞吐量和故障率方面近乎最优的性能。

Mar, 2020

一个用于多小区网络下行功率分配的深度 Q 学习方法

本文提出了一种基于深度强化学习的下行功率分配方案，旨在最大化总网络吞吐量，该方案与传统的功率分配方案相比表现更好，在多小区场景中，通过深度 Q 学习方法实现近似最优功率分配策略，使用遗传算法作为基准来获得近似最优功率分配解。

Apr, 2019

通过强化学习的实时频谱监测 ——Q 学习和启发式方法的比较

本研究比较了线性频率调谐作为启发式方法和来自强化学习领域的 Q-learning 算法这两种不同方法在控制可用接收机资源方面。经过简化的情景测试表明，Q-learning 算法相对于启发式方法具有更高的检测率，同时可以通过参数化实现检测与探索率之间的权衡。

Jul, 2023

5G 网络的深度强化学习：联合波束形成、功率控制和干扰协调

本文讨论了如何使用深度强化学习来优化 5G 网络中的波束成形、功率控制和干扰协同，并将其构建为一个非凸优化问题，以最大化信号干扰加噪声比（SINR）; 该算法在子 6 GHz 和毫米波（mmWave）频段的语音无线电和数据无线电中都取得了更好的性能。

Jun, 2019

智能反射面辅助 D2D 通信的深度强化学习

本文提出了一个基于深度强化学习的方法，用于解决智能反射面支持下的设备对设备通信网络和的和速率优化问题。通过优化发射功率和相位转换矩阵，模拟结果表现优异。

Aug, 2021

使用深度强化学习的 QoS 和干扰感知无线网络

提出一种抵御干扰攻击的无线网络建模方案，通过干扰感知的路由协议和基于深度强化学习的分布式合作框架实现有效通讯以及网络安全防御，并优化吞吐量，能效，时延和安全指标。通过实验表明，提出的方案在对抗干扰攻击和实现优化吞吐量方面具有很好的鲁棒性和有效性。

Oct, 2019

针对 5G 不同服务质量需求的无线资源分配的深度学习

本文提出了一种基于深度学习的资源分配策略，通过优化带宽和传输功率来最小化基站的总功耗，并使用级联结构的神经网络和深度迁移学习来应对无线网络中的非平稳性。实验结果表明，相对于全连接神经网络，在 QoS 保证方面，级联神经网络的性能更好。

Mar, 2020