分解环境的分阶段强化学习用于复杂任务

Nov, 2023

分解环境的分阶段强化学习用于复杂任务

Staged Reinforcement Learning for Complex Tasks through Decomposed Environments

Rafael Pina, Corentin Artaud, Xiaolan Liu, Varuna De Silva

TL;DR通过将复杂任务分解为多个子任务并在交通路口模拟中引入多智能体训练机制，本研究提出了两种方法来近似强化学习问题并改善代理人在复杂任务中的性能，从而减少潜在的安全问题。

Abstract

reinforcement learning (RL) is an area of growing interest in the field of artificial intelligence due to its many notable applications in diverse fields. Particularly within the context of intelligent vehicle control

reinforcement learning intelligent vehicle control simulation experience traffic junction simulations multi-agent

发现论文，激发创造

基于深度强化学习的实际驾驶环境离散控制

本篇研究提出了一个基于真实驾驶环境的 MDP 框架，使用多智能体学习算法来实现对自动驾驶车辆的训练，并提出了可靠的初始化、数据增强和训练技术来实现最小化的视频数据和培训，最终在 TORCS 虚拟驾驶环境中得到了验证。

Nov, 2022

基于场景分解的安全强化学习在复杂城市环境下的导航

我们提出了一种基于模块化的决策算法，以自主导航十字路口的挑战，通过安全机制，置信度更新技术和场景分解方法，提高了行车安全性和决策鲁棒性，并在复杂的十字路口情境中表现了优越性。

Apr, 2019

自主驾驶的深度强化学习：一份综述

本文综述了深度强化学习算法在自动驾驶任务上的应用，包括分类、验证、测试和强化现有强化学习算法解决方案的方法，还介绍了相关领域和挑战。

Feb, 2020

基于深度强化学习的分层任务分解：拾取和放置子任务

提出一种多子任务增强学习的方法，将复杂的拾取和放置任务分解为低级子任务，并通过 DRL 方法学习，然后高级协调员将训练好的子任务组合来完成拾取和放置任务，此方法在样本效率方面表现优于以 LfD 为基础的基准方法，并在实际机器人系统中展示了鲁棒的抓握能力。

Feb, 2021

可控行为的弱监督强化学习

本文介绍了一种使用弱监督来自动区分语义明确的任务子空间和无意义的 “杂草” 任务空间的方法。研究表明，这种学习到的子空间可实现高效探索，并提供了一种捕捉状态间距离的表示形式。该方法在多种具有挑战性的基于视觉的连续控制问题中实现了显著的性能提升，特别是在环境复杂性增加的情况下。

Apr, 2020

基于深度强化学习的 CARLA 模拟自动驾驶

本论文基于强化学习（RL）与 Deep Q-Learning 框架以及 CARLA 仿真环境，探索了一种实现自动驾驶车辆在高速行驶时保持车道并避让其他车辆的策略，以提高交通安全性。

Jun, 2023

闭环中学习真实交通代理

使用闭环模拟学习方法 RTR，在模拟和真实数据集中训练交通仿真策略，以提高交通规则遵守性和仿真的真实性。

Nov, 2023

来自真实多智能体演示的强化学习中的自适应动作监督

本文提出了一种自适应动作监督的 RL 方法，通过动态时间规整的最小距离选择 RL 真实世界演示中的动作，使得 RL 模型能够在网络空间获得回报

May, 2023

现实世界强化学习挑战的经验研究

本文针对强化学习在实际问题中难以部署的问题，提出了一系列的挑战，并通过 Markov 决策过程定义这些挑战并分析其影响，同时探讨了一些现有的解决方法。为了验证算法的可部署性，我们提出并开源了 realworldrl-suite 套件作为一个基准测试集。

Mar, 2020

多智能体系统的深度强化学习：挑战、解决方案和应用综述

此篇论文介绍了多智能体深度强化学习的不同方法，包括非静态性、部分可观测性、连续的状态和操作空间、多智能体训练机制、多智能体转移学习，并分析和讨论了这些方法的优缺点及其相关应用，旨在促进更加健壮和高效的多智能体学习方法的发展。

Dec, 2018