V2V 通信资源分配的深度强化学习

Nov, 2017

Deep Reinforcement Learning for Resource Allocation in V2V Communications

Hao Ye, Geoffrey Ye Li

TL;DR本文提出了一种基于深度强化学习的分散式资源分配机制，以优化车对车通信系统的信道和功率分配，同时减小对车对基础设施通信系统的干扰。

Abstract

In this article, we develop a decentralized resource allocation mechanism for vehicle-to-vehicle (V2V) communication systems based on deep reinforcement learning. Each v2v link is considered as an agent, making i

decentralized resource allocation vehicle-to-vehicle communication systems deep reinforcement learning v2v link optimization

发现论文，激发创造

基于深度强化学习的 V2V 通信资源分配

本文基于深度强化学习，开发了一种分散资源分配机制，应用于车对车（V2V）通信中，在无单播和广播场景下均可使用。根据分散的资源分配机制，一个自治体、一个 V2V 链路或一辆车，可以在不要求或等待全局信息的情况下，做出决策，查找传输的最佳子带宽和功率水平。由于所提出的方法是分散的，因此仅产生有限的传输开销。根据仿真结果，每个自治体可以有效地学习，以满足对 V2V 链路的严格延迟约束，同时将干扰降至最低。

May, 2018

基于深度强化学习的蜂窝 V2X 通信模式选择和资源分配

本文研究了细胞 V2X 通信的传输模式选择和资源分配问题，将其制定为马尔可夫决策过程，提出了基于深度增强学习的去中心化算法，同时开发了基于图论的车辆聚类算法和分布式学习算法。实验结果表明，所提出的算法优于其他分布式基线算法，并验证了两个时间尺度的联邦 DRL 算法在新激活的 V2V 对中的优越性。

Feb, 2020

基于深度学习的车联网无线资源分配

本文介绍深度学习在车联网中用于资源分配的关键动因和障碍，并回顾了近期在利用深度学习哲学解决无线资源分配问题方面取得的重要成果。通过深度强化学习和优化技术，探究当前设计方法所面临的挑战，并提出未来资源分配研究的一些方向。

Jul, 2019

基于多智能体强化学习的车联网频谱共享

本文研究了基于多智能体强化学习的车联网频谱共享问题，并使用适于分布式实现的基于指纹的深度 Q 网络方法解决了资源共享问题，展示了多个 V2V 智能体成功合作以分布式方式提高效率。

May, 2019

多智能体强化学习在基于竞拍的长期网络资源分配中的应用：V2X 应用

本文旨在研究如何实现计算任务从移动代理转移，其提出了一种基于分散决策的机制来促使代理间在博弈与合作之间平衡。为此，该文设计了一个新的多代理在线学习算法，并通过 V2X 应用的模拟得出了良好的收敛性和泛化性能。

Jul, 2022

基于深度强化学习的混合 V2X 通信算法：基准研究

本文基于航天工业的冗余原则，提出在 V2X 技术中引入多种无线接入技术，通过在复杂变化的通道和交通条件下使用深度强化学习算法解决垂直切换问题，并通过实验结果验证了这种方法能够降低通信成本并提高可靠性。

Oct, 2023

强化学习用于联合 V2I 网络选择和自主驾驶策略

本文提出一个基于强化学习的框架，以最小化道路碰撞、最大化通信数据速率的目标，同时优化自动驾驶车辆的网络选择和驾驶策略。通过将问题转化为马尔可夫决策过程并基于深度 Q 学习来优化加速度、减速度、变道和车辆 - 基站分配等行为，实现了安全驾驶和以改进的连通性。

Aug, 2022

分布式非协调认知无线电资源分配的深度强化学习

本文提出了一种基于深度强化学习的分布式资源分配技术，用于多代理环境下的认知无线电网络，该网络通过干扰下动态频谱访问与主干网络共存。该技术是分布式的，且不需要与其他代理协调，通过模拟结果可以显示出，该技术能够在有限的学习时间内，找到使性能在 3％之内的策略。

Oct, 2019

使用强化学习对覆盖范围外车辆通信进行调度

本研究提出了一种使用强化学习的集中式调度程序（VRLS），用于提高无蜂窝覆盖区域内车辆间通信的可靠性，并评估了其性能表现。该程序可以在模拟车辆环境中学习一种稳健和适应性强的调度策略，为出行前分配资源，并在无蜂窝覆盖区域内优于现有分布式调度算法的表现。

Jul, 2022

V2X 网络中资源分配的联邦强化学习

在车联网（V2X）网络中，我们通过联邦强化学习（FRL）框架探索资源分配，并使用非精确交替方向乘子法（ADMM）实现了算法 PASM，在 V2X 网络中解决资源分配问题，并与基线方法进行了比较。

Oct, 2023