多智能体强化学习在基于竞拍的长期网络资源分配中的应用：V2X 应用

Jul, 2022

多智能体强化学习在基于竞拍的长期网络资源分配中的应用：V2X 应用

Multi-Agent Reinforcement Learning for Long-Term Network Resource Allocation through Auction: a V2X Application

Jing Tan, Ramin Khalili, Holger Karl, Artur Hecker

TL;DR本文旨在研究如何实现计算任务从移动代理转移，其提出了一种基于分散决策的机制来促使代理间在博弈与合作之间平衡。为此，该文设计了一个新的多代理在线学习算法，并通过 V2X 应用的模拟得出了良好的收敛性和泛化性能。

Abstract

We formulate offloading of computational tasks from a dynamic group of mobile agents (e.g., cars) as decentralized decision making among autonomous agents. We design an interaction mechanism that incentivizes suc

offloading decentralized decision making multi-agent learning v2x application resource allocation

发现论文，激发创造

基于深度强化学习的 V2V 通信资源分配

本文基于深度强化学习，开发了一种分散资源分配机制，应用于车对车（V2V）通信中，在无单播和广播场景下均可使用。根据分散的资源分配机制，一个自治体、一个 V2V 链路或一辆车，可以在不要求或等待全局信息的情况下，做出决策，查找传输的最佳子带宽和功率水平。由于所提出的方法是分散的，因此仅产生有限的传输开销。根据仿真结果，每个自治体可以有效地学习，以满足对 V2V 链路的严格延迟约束，同时将干扰降至最低。

May, 2018

V2V 通信资源分配的深度强化学习

本文提出了一种基于深度强化学习的分散式资源分配机制，以优化车对车通信系统的信道和功率分配，同时减小对车对基础设施通信系统的干扰。

Nov, 2017

基于深度强化学习的蜂窝 V2X 通信模式选择和资源分配

本文研究了细胞 V2X 通信的传输模式选择和资源分配问题，将其制定为马尔可夫决策过程，提出了基于深度增强学习的去中心化算法，同时开发了基于图论的车辆聚类算法和分布式学习算法。实验结果表明，所提出的算法优于其他分布式基线算法，并验证了两个时间尺度的联邦 DRL 算法在新激活的 V2V 对中的优越性。

Feb, 2020

动态车联网中的 DNN 划分、任务卸载和资源分配：一种基于 Lyapunov 导引的扩散强化学习方法

人工智能和深度神经网络在车辆网络生态系统中的快速发展引入了计算密集型任务，对单个车辆的计算资源需求超过其能力，为解决这一挑战，车辆边缘计算作为一个解决方案应运而生，通过车辆间 / 基础设施之间的通信资源池提供深度神经网络任务的计算服务，本文将 VEC 中的 DNN 划分、任务卸载和资源分配问题建模为动态长期优化问题，目标是在时间上保证系统稳定的同时尽量减少 DNN 任务的完成时间，首先利用 Lyapunov 优化技术将原始的长期优化问题与稳定约束解耦成每个时隙的确定性问题，然后提出了一种基于 Multi-Agent Diffusion-based Deep Reinforcement Learning (MAD2RL) 算法，通过创新性地使用扩散模型来确定最优的 DNN 划分和任务卸载决策，在 MAD2RL 中还将凸优化技术作为子程序加以整合来分配计算资源，提高学习效率，通过对真实世界车辆移动轨迹的模拟，我们证明了我们所提出的算法相对于现有的基准解决方案具有更优越的性能。

Jun, 2024

V2X 网络中资源分配的联邦强化学习

在车联网（V2X）网络中，我们通过联邦强化学习（FRL）框架探索资源分配，并使用非精确交替方向乘子法（ADMM）实现了算法 PASM，在 V2X 网络中解决资源分配问题，并与基线方法进行了比较。

Oct, 2023

基于多智能体强化学习的无人机网络资源分配

本文探讨了使用无人机作为空中基站提供无线通信服务的动态资源分配问题，并通过多智能体强化学习框架实现了长期收益的最大化。研究结果表明，该算法在信息交互开销和性能提升之间取得了良好的平衡。

Oct, 2018

基于多智能体强化学习的车联网频谱共享

本文研究了基于多智能体强化学习的车联网频谱共享问题，并使用适于分布式实现的基于指纹的深度 Q 网络方法解决了资源共享问题，展示了多个 V2V 智能体成功合作以分布式方式提高效率。

May, 2019

利用强化学习进行物联网边缘计算资源分配

本文提出一种边缘计算中使用强化学习来降低能耗和任务执行延迟的近似最优算法。

Mar, 2019

分布式和非协同认知无线电资源分配的深度强化学习

本文提出了一种分布式的深度强化学习资源分配技术，针对协作无线电网络所呈现的多智能体环境及其强化学习过程中可能导致的非平稳环境，通过考虑深度强化学习的特定方面，本文的算法能够迭代地收敛于一个平衡政策，其可用于无需与其他代理协调配合的情况下工作。仿真结果表明，与等效的基于 Q 表的 Q 学习算法相比，所提出的技术具有更快的学习性能，并能够在足够长的学习时间内在 99% 的情况下找到最优策略。此外，对于与等效的基于表格的实现相比，仿真结果显示出我们的 DQL 方法只需要不到一半的学习步骤才能实现相同的性能。此外，证明了在未协调交互的多无线电情景中使用标准的单智能体深度强化学习方法可能无法收敛。

May, 2022

基于自适应学习的车联网边缘计算任务卸载系统

本论文针对汽车间的计算任务卸载环境动态不确定的挑战，提出了一种基于自适应学习的任务卸载算法，在多臂赌博理论基础上，利用邻近车辆的卸载延迟性能进行学习并且能够适应动态环境，实现了分布式协作的任务卸载，并证明了具有子线性的学习遗憾。在综合考虑各种不确定性的条件下，实验结果表明，相比现有的以置信上限为基础的学习算法，该算法使任务卸载延迟性能更优，平均延迟降低了高达 30%。

Jan, 2019