电动车、无线充电、车辆调度、深度强化学习、移动能源传播是本研究的关键词。通过使用深度强化学习方法,本论文提出了一个车辆调度框架,可以显著提升电动车的行驶里程并更高效地部署移动能源传播装置。该模型具有实用性和可行性,可帮助用户最大程度地延长电动车的续航里程,并帮助道路管理机构或私营部门有效管理移动能源传播装置的部署。
Aug, 2023
该论文提出一种新的端到端强化学习方法来规划机载无人机收集物联网中的分布式传感器节点的数据,以实现对下一代通信网络的支持。通过训练一个双重深度 Q 网络来实现对不同情况参数的泛化控制,从而使代理可以根据平衡数据收集目标和飞行时间效率的安全约束,在各种场景参数下做出运动决策。
Jul, 2020
智能无人机群体结合充电技术可以在智能城市中提供完整的感知能力,如交通监控和灾害响应。通过分布式优化和深度强化学习(DRL)等现有方法,旨在协调无人机以实现成本效益高、质量高的导航、感知和充电。然而,它们存在明显挑战:短期优化难以提供持续效益,而长期 DRL 缺乏可扩展性、韧性和灵活性。为弥合这一差距,本文介绍了一种新的渐进式方法,包括基于分布式优化的规划和选择,以及基于 DRL 的飞行方向调度。通过对从真实城市流动性生成的数据集进行的广泛实验,与三种基准方法相比,所提出的解决方案在交通监控方面表现出色。
Nov, 2023
本文使用深度强化学习技术研究了 IoT 驱动孤立微电网中柴油发电机(DG)的调度问题。旨在在可再生能源不确定性情况下充分利用可再生能源,通过离散 - 连续混合动作空间的 DRL 算法解决了二进制 DG 开关决策和连续能量调度决策,并针对旋转备用的情况提出了 POMDP 模型,实验显示其性能要优于同类算法。
Apr, 2023
本文旨在解决电动汽车在参与需求响应时如何优化充电 / 放电计划的问题。通过将问题建模为约束马尔可夫决策过程并采用增广拉格朗日方法和软性演员评论算法,提出了一种新的安全非同步策略优化强化学习方法,能够显著提高方案最优性和约束限制的达成。
Sep, 2022
本文旨在设计一种任务调度策略,以最小化所有任务的离线和计算延迟,同时满足无人机能源容量约束下的延迟导向物联网服务需求,并考虑到任务到达动态变化的情况,提出了基于风险敏感的强化学习算法来解决能耗风险约束下的决策问题。
Oct, 2020
本文阐述了如何将深度强化学习算法应用于机器人领域,主要关注于以物理模拟平台为基础的无人机飞行任务控制,使用基于 Gazebo 的强化学习框架进行训练,最终成功实现了无人机自主降落的任务
本文提出使用强化学习和马尔科夫决策过程 (MDP) 来协调多个电动汽车充电点,通过减少训练时间和使用线性空间和时间复杂度的新 MDP 公式,改善了业内现有技术,提高了充电需求协调达 40-50%的性能。
Mar, 2022
该研究提出了一种在多个无人机的辅助下,针对动态环境中的无线供能通信网络(WPCN)的新设计。通过引入新的基于双阈值的无线节点类型更新规则,以及多智能体深度强化学习(MAHDRL)框架,能有效解决航迹决策和能源传输与数据收集决策的优化问题。通过大量的仿真实验结果验证了该方法在各种国际先进基准测试中的卓越性能。
Dec, 2023
应用深度强化学习算法 (HAFH-DDPG),在离网微电网中实现联合能量调度和机组启停决策来减少总发电成本,并支持简化后的行动空间。
Jun, 2022