本文基于航天工业的冗余原则,提出在 V2X 技术中引入多种无线接入技术,通过在复杂变化的通道和交通条件下使用深度强化学习算法解决垂直切换问题,并通过实验结果验证了这种方法能够降低通信成本并提高可靠性。
Oct, 2023
本文研究了细胞 V2X 通信的传输模式选择和资源分配问题,将其制定为马尔可夫决策过程,提出了基于深度增强学习的去中心化算法,同时开发了基于图论的车辆聚类算法和分布式学习算法。实验结果表明,所提出的算法优于其他分布式基线算法,并验证了两个时间尺度的联邦 DRL 算法在新激活的 V2V 对中的优越性。
Feb, 2020
本文提出一个基于强化学习的框架,以最小化道路碰撞、最大化通信数据速率的目标,同时优化自动驾驶车辆的网络选择和驾驶策略。通过将问题转化为马尔可夫决策过程并基于深度 Q 学习来优化加速度、减速度、变道和车辆 - 基站分配等行为,实现了安全驾驶和以改进的连通性。
Aug, 2022
一种基于深度强化学习的多时间尺度控制和通信的联合优化框架被提出,以车队控制(PC)为示例应用。为了改善 PC 在随机观察延迟下的性能,采用了细粒度嵌入式模拟 C-V2X 通信生成的延迟环境进行训练,并与基线 DRL 算法的性能进行比较。
Nov, 2023
为实现自主车队所需的无线网络可靠性和控制系统稳定性,本文提出了一个新的框架,通过分析控制系统的稳定性和车辆间通信信道的不确定性,导出了无线系统可靠性的运算表达式,并将控制参数优化以最大化无线系统的可靠性。
Apr, 2018
本文提出了一种简化的车辆微观模拟方法,并使用深度强化学习优化了具有不同车辆组成的六个交通系统的控制策略,发现了类似于波浪消减、交通信号和匝道计量等的多种新行为,并分析了这些行为以获得可解释的控制策略。
Jul, 2022
通过车辆之间的协作自主驾驶和车辆间通信,以车队行驶为应用场景,在城市环境中使用深度强化学习和物理模拟技术,实现了交通流量和安全的提升。
Dec, 2023
通过使用一种简化的群体策略作为知识共享机制,我们提出了一种新颖的框架,用于车队的共享学习,以解决深度强化学习在服务路线分布的车队中学习稳定性问题,从而在燃油经济性等指标上取得明显优势。
Apr, 2024
本文提出了一种去中心化的协作感知方法,基于 Deep Reinforcement Learning 算法,学习一种反向通讯策略,只请求未知信息,最终实现交通物品的最大化感知和最小化信息交流成本的平衡调整。
Dec, 2022
本文提出了一种基于深度增强学习和动态规划的算法 Finite-Horizon-DDPG-SS,用于解决车队中车辆跟随控制问题,通过真实驾驶数据的仿真验证了该算法的有效性,并且能够提高车队的安全性和稳定性。
Jun, 2022