基于多智能体强化学习的车联网频谱共享
本文提出一个基于强化学习的框架,以最小化道路碰撞、最大化通信数据速率的目标,同时优化自动驾驶车辆的网络选择和驾驶策略。通过将问题转化为马尔可夫决策过程并基于深度 Q 学习来优化加速度、减速度、变道和车辆 - 基站分配等行为,实现了安全驾驶和以改进的连通性。
Aug, 2022
本文基于深度强化学习,开发了一种分散资源分配机制,应用于车对车(V2V)通信中,在无单播和广播场景下均可使用。根据分散的资源分配机制,一个自治体、一个 V2V 链路或一辆车,可以在不要求或等待全局信息的情况下,做出决策,查找传输的最佳子带宽和功率水平。由于所提出的方法是分散的,因此仅产生有限的传输开销。根据仿真结果,每个自治体可以有效地学习,以满足对 V2V 链路的严格延迟约束,同时将干扰降至最低。
May, 2018
本文研究了高速移动车联网环境中的语义通信,重点关注车对车和车对基础设施通信之间的频谱共享。我们提出了一种基于深度强化学习软演员 - 评论家算法的语义感知频谱共享算法(SSS),通过优化 V2V 和 V2I 频谱共享的决策来提高语义信息的传输效率和成功率。实验结果表明,SSS 算法在 HSSE 和 SRS 方面的性能优于其他基线算法。
Jun, 2024
本文研究了细胞 V2X 通信的传输模式选择和资源分配问题,将其制定为马尔可夫决策过程,提出了基于深度增强学习的去中心化算法,同时开发了基于图论的车辆聚类算法和分布式学习算法。实验结果表明,所提出的算法优于其他分布式基线算法,并验证了两个时间尺度的联邦 DRL 算法在新激活的 V2V 对中的优越性。
Feb, 2020
本文提出一种新型的动态频谱共享方案,并使用深度强化学习算法基于蒙特卡罗树搜索进行资源分配,该方案能够在考虑未来网络状态的情况下执行操作,比当前的其他方案表现更好。
Feb, 2021
本文旨在研究如何实现计算任务从移动代理转移,其提出了一种基于分散决策的机制来促使代理间在博弈与合作之间平衡。为此,该文设计了一个新的多代理在线学习算法,并通过 V2X 应用的模拟得出了良好的收敛性和泛化性能。
Jul, 2022
本研究使用强化学习方法,将两个设备间的无线通信建模为优化双向通信策略的问题,以此解决传统无线通信领域所面临的问题,如人工频谱稀缺、无法动态分配频率等。实验结果表明所提出的方法具有优越的学习能力和智能性。
Jan, 2018
本文提出了一个学习框架来优化无线网络的频谱和功率分配,使用两种分别针对离散和连续变量的强化学习算法来同时执行和训练,模拟结果表明该方案优于基于分数规划的算法和以往基于深度强化学习的解决方案。
Dec, 2020