结构增强的深度强化学习在最优传输调度中的应用
提出了一种利用深度强化学习和混合整数规划的框架,用于优化能量储存系统的调度决策,同时严格执行操作约束,以及在存在不确定性的环境中取得高质量的调度决策。
Jul, 2023
本文研究了语义感知下的调度问题,利用深度强化学习算法解决大规模系统中的最优策略问题,并通过实验表明,相较于现有算法,所提出的算法能够显著减少训练时间并提高训练性能。
May, 2023
基于优化理论的深度强化学习框架被介绍用于联合设计控制和通信系统,并针对最小化功耗目标,在满足通信系统的调度性和速率约束以及控制系统的稳定性约束的前提下,通过优化理论和深度强化学习两个阶段的组合来实现,该方法在大量的模拟实验中表现出优于优化理论和纯深度强化学习方法的性能,接近最优性能且复杂度较低。
Nov, 2023
深度强化学习 (DRL) 在机器调度问题中的方法和应用进行了全面的综述和比较,发现 DRL 方法在计算速度和生成接近全局最优解方面表现优于其他方法,但面临着处理复杂操作约束、多目标优化、泛化性、可扩展性、解释性和鲁棒性等限制,解决这些挑战将是未来研究中的关键焦点。该论文为研究人员评估当前 DRL 机器调度领域的现状以及发现研究空白提供了宝贵的资源,同时也帮助专家和从业者选择适合生产调度的 DRL 方法。
Oct, 2023
本文提出了一个基于深度强化学习的方法,用于解决智能反射面支持下的设备对设备通信网络和的和速率优化问题。通过优化发射功率和相位转换矩阵,模拟结果表现优异。
Aug, 2021
提出了一种基于模型的深度强化学习方法,用于设计短期电压稳定性问题的紧急控制策略,并使用基于深度神经网络 的动态代理模型进行训练,最终在 IEEE 300 总线测试系统上实现了 97.5% 的样本效率和 87.7% 的训练效率。
Dec, 2022
探究基于无线网络控制系统的深度学习协同设计,使用新型深度强化学习算法与 AoI 技术构建控制器和调度器,提高数据准确性并增强联合训练的稳定性,以此解决传统设计方法中大量难以有效解决的问题,并在不同场景中提供显著的性能表现.
Oct, 2022
该研究利用平均成本约束马尔可夫决策过程理论和 Lagrangian 动态规划,探索了在有损且受速率限制的通道上进行多个马尔可夫源的远程估计的语义感知通信;通过使用结构优化结果和开发新的策略搜索算法,可以最小化长期状态依赖成本和估计误差;为了避免马尔可夫决策过程的维度问题,提出了基于 Lyapunov 优化定理的在线低复杂度 Drift-plus-Penalty 调度算法。
Mar, 2024
本文提出一种新型的动态频谱共享方案,并使用深度强化学习算法基于蒙特卡罗树搜索进行资源分配,该方案能够在考虑未来网络状态的情况下执行操作,比当前的其他方案表现更好。
Feb, 2021