自适应分布式强化学习的多目标优化

Mar, 2024

自适应分布式强化学习的多目标优化

Multi-Objective Optimization Using Adaptive Distributed Reinforcement Learning

Jing Tan, Ramin Khalili, Holger Karl

TL;DR提出了一个高学习效率、计算要求低的多目标、多智能体强化学习算法，适用于动态、分布式和嘈杂环境，通过稀疏和延迟奖励自动触发自适应的少样本学习，在智能交通系统中经过实证研究和与现有算法的比较，取得了更好的性能。

Abstract

The intelligent transportation system (ITS) environment is known to be dynamic and distributed, where participants (vehicle users, operators, etc.) have multiple, changing and possibly conflicting objectives. Although r

intelligent transportation system reinforcement learning multi-objective multi-agent edge cloud computing

发现论文，激发创造

混合信息驱动多智能体强化学习

利用信息理论模型作为启发式算法来帮助大规模稀疏状态的代理系统寻找高级策略的混合信息驱动多代理强化学习（MARL）方法被提出和研究。通过初步实验结果表明，这一方法可以使代理系统在探索稀疏状态空间方面获得高达三个数量级的有效性提升。

Feb, 2021

基于多智能体强化学习的分布式自主交叉口管理方法

提出了一个使用多智能体强化学习（MARL）的分布式方法来解决自主交叉口管理（AIM）中的问题，利用 3D 环视技术实现了无需中央控制器的精确导航，同时引入了优先情景回放策略以提高训练效果。实验证明该方法作为传统中央化 AIM 技术的创新替代方案，在 SMARTS 平台的虚拟环境中超越了各种度量指标的基准。

May, 2024

多智能体深度强化学习用于大规模交通信号控制

本文提出了一种可完全扩展和去中心化的多智能体 A2C 算法，以提高城市交通网络中的自适应交通信号控制的可观测性和减少学习难度，并在大型合成交通网格和摩纳哥城的大型实际交通网络下，通过模拟高峰流量动态，并将其与独立 A2C 和独立 Q-learning 算法进行比较，结果表明其优化性、鲁棒性和样本效率优于其他最先进的去中心化 MARL 算法。

Mar, 2019

利用强化学习和部分车辆检测实现智能交通信号控制

本研究基于 DSRC，使用强化学习算法研发一种部分可观测智能交通系统，能够有效降低交叉口内车辆的平均等待时间，即使检测速率较低。

Jul, 2018

多智能体强化学习介绍及其在自主移动中的应用综述

该论文介绍了多智能体强化学习在自主移动中的应用，包括行为规划、车辆之间通信、性能提升等方面，并探讨了该领域的一些最新方法和想法。

Mar, 2022

基于策略深度强化学习和智能路由的自主车辆交通管理

提出了一种基于深度强化学习的信号控制系统，该系统可以根据交通状况动态调整信号并使用重新路由技术平衡道路网络上的车辆，以帮助优化交通流的管理和减少拥堵。

Jun, 2022

iPLAN: 分布式多智能体强化学习在异质交通中的意图感知规划

本文提出了一种分布式多智能体强化学习算法，采用轨迹和意图预测，以应对自动驾驶汽车在密集交通情况下的安全和高效导航问题，并采用 iPLAN 方法进行意图感知规划，通过设计两种激励模块，促进从行为和长期的驾驶策略与当前交通情况的短期策略方面进行决策，仿真实验结果表明，与集中式 MARL 基线相比，本文提出的方法在混乱交通中的奖励、成功率和幸存时间上均有所提高。

Jun, 2023

利用场均多智能体强化学习进行高效拼车订单调度

本研究采用多个智能体玩游戏的强化学习方法，结合平均场近似对订单调度问题进行建模，成功降低高峰期的供需差异并减少交通拥堵。

Jan, 2019

多智能体图强化学习中的学习分散式交通信号控制器

本文研究智能城市中的交通信号优化控制问题，通过多智能体强化学习的新分散控制架构和图学习算法，提出了一种新的去中心化控制策略，增强了环境可观测性以抓取交通信号的时空关联性，实验证明该方案优于现有的分散算法。

Nov, 2023

完全分布式雾计算负载均衡与多智能体强化学习

提出了一种使用多智能体强化学习的全分布式负载平衡解决方案，通过智能地分布物联网工作负载，在提供公平资源利用的同时优化等待时间，从而最小化等待时间并改善端到端执行延迟。

May, 2024