结构增强的深度强化学习在最优传输调度中的应用

Nov, 2022

结构增强的深度强化学习在最优传输调度中的应用

Structure-Enhanced Deep Reinforcement Learning for Optimal Transmission Scheduling

Jiazheng Chen, Wanchun Liu, Daniel E. Quevedo, Yonghui Li, Branka Vucetic

TL;DR本文研发了一种结构增强的深度强化学习算法用于最小化远程估计均方误差，实现在多传感器远程估计系统的最优调度，该算法可以比基准算法节省 50％的训练时间并将远程估计均方误差降低 10％至 25％。

Abstract

remote state estimation of large-scale distributed dynamic processes plays an important role in industry 4.0 applications. In this paper, by leveraging the theoretical results of structural properties of

remote state estimation deep reinforcement learning multi-sensor system optimal scheduling industry 4.0

发现论文，激发创造

一种用于最优能量储存系统调度的约束强化深度学习框架

提出了一种利用深度强化学习和混合整数规划的框架，用于优化能量储存系统的调度决策，同时严格执行操作约束，以及在存在不确定性的环境中取得高质量的调度决策。

Jul, 2023

语义感知传输调度：基于单调性的深度强化学习方法

本文研究了语义感知下的调度问题，利用深度强化学习算法解决大规模系统中的最优策略问题，并通过实验表明，相较于现有算法，所提出的算法能够显著减少训练时间并提高训练性能。

May, 2023

基于优化理论的深度强化学习用于超可靠无线网络控制系统资源分配

基于优化理论的深度强化学习框架被介绍用于联合设计控制和通信系统，并针对最小化功耗目标，在满足通信系统的调度性和速率约束以及控制系统的稳定性约束的前提下，通过优化理论和深度强化学习两个阶段的组合来实现，该方法在大量的模拟实验中表现出优于优化理论和纯深度强化学习方法的性能，接近最优性能且复杂度较低。

Nov, 2023

深度强化学习在机器调度中的应用方法、现状和未来方向

深度强化学习 (DRL) 在机器调度问题中的方法和应用进行了全面的综述和比较，发现 DRL 方法在计算速度和生成接近全局最优解方面表现优于其他方法，但面临着处理复杂操作约束、多目标优化、泛化性、可扩展性、解释性和鲁棒性等限制，解决这些挑战将是未来研究中的关键焦点。该论文为研究人员评估当前 DRL 机器调度领域的现状以及发现研究空白提供了宝贵的资源，同时也帮助专家和从业者选择适合生产调度的 DRL 方法。

Oct, 2023

智能反射面辅助 D2D 通信的深度强化学习

本文提出了一个基于深度强化学习的方法，用于解决智能反射面支持下的设备对设备通信网络和的和速率优化问题。通过优化发射功率和相位转换矩阵，模拟结果表现优异。

Aug, 2021

分布式流数据处理的无模型深度强化学习控制

该论文提出了一种使用深度强化学习实现分布式流数据处理系统无模型控制的新方法，并通过实验验证其在处理元组的时间效率方面的有效性和实用性。

Mar, 2018

基于模型的深度强化学习电压控制策略高效学习

提出了一种基于模型的深度强化学习方法，用于设计短期电压稳定性问题的紧急控制策略，并使用基于深度神经网络的动态代理模型进行训练，最终在 IEEE 300 总线测试系统上实现了 97.5% 的样本效率和 87.7% 的训练效率。

Dec, 2022

用于无线网络系统的深度学习：联合估计 - 控制 - 调度方法

探究基于无线网络控制系统的深度学习协同设计，使用新型深度强化学习算法与 AoI 技术构建控制器和调度器，提高数据准确性并增强联合训练的稳定性，以此解决传统设计方法中大量难以有效解决的问题，并在不同场景中提供显著的性能表现.

Oct, 2022

基于语义感知的多个马尔可夫源在约束下的远程估计

该研究利用平均成本约束马尔可夫决策过程理论和 Lagrangian 动态规划，探索了在有损且受速率限制的通道上进行多个马尔可夫源的远程估计的语义感知通信；通过使用结构优化结果和开发新的策略搜索算法，可以最小化长期状态依赖成本和估计误差；为了避免马尔可夫决策过程的维度问题，提出了基于 Lyapunov 优化定理的在线低复杂度 Drift-plus-Penalty 调度算法。

Mar, 2024

LTE 和 NR 的动态频谱共享的深度强化学习

本文提出一种新型的动态频谱共享方案，并使用深度强化学习算法基于蒙特卡罗树搜索进行资源分配，该方案能够在考虑未来网络状态的情况下执行操作，比当前的其他方案表现更好。

Feb, 2021