用无监督技能发现进行分层学习，用于高速公路合并应用

Feb, 2023

用无监督技能发现进行分层学习，用于高速公路合并应用

Hierarchical Learning with Unsupervised Skill Discovery for Highway Merging Applications

Yigit Gurses, Kaan Buyukdemirci, Yildiray Yildiz

TL;DR本研究提出了一种层次学习方法，该方法使用未经预设奖励功能的无监督技能发现获取运动原语作为动作，可减少基于惩罚奖励机制的强化学习方法的总训练时间，该方法通过模拟实验表明其产生的驾驶员模型能够更快地展现高性能。

Abstract

Driving in dense traffic with human and autonomous drivers is a challenging task that requires high level planning and reasoning along with the ability to react quickly to changes in a dynamic environment. In this study, we propose a →

autonomous drivers hierarchical learning approach motion primitives unsupervised skill discovery driver models

发现论文，激发创造

基于技能发现的自动驾驶车辆交叉口自适应决策

提出一种基于强化学习和动作基元的分层框架，可自主收集和重复使用知识来解决城市环境下自动驾驶面临的挑战和不确定性，通过 CARLA 模拟器的测试，其表现优于其他基线方法。

Jul, 2022

基于分层模仿学习的城市驾驶可解释运动规划器

本文介绍了一种分层的模仿学习方法，包括一个高层次基于网格的行为规划器和一个低层次的轨迹规划器来增强神经网络的可靠性和稳定性。该方法可以被嵌入到基于规则的架构中，且在封闭回路仿真和实际驾驶测试中表现卓越，特别适用于复杂的城市自动驾驶场景。

Mar, 2023

自主驾驶的层次行为和运动规划学习

通过引入分层行为和运动规划（HBMP），我们在学习驾驶解决方案中显式地建模行为，解决了不同场景的 RL 训练效率低下的问题，并在 SUMO 的快速事件仿真器中进行训练，最终在 CARLA 动力学仿真器中进行训练并转移到现实世界，证明了该方法的有效性和可推广性。

May, 2020

自主驾驶层次强化学习无需依赖标签驾驶数据决策

本文提出了一种基于分层强化学习的自动驾驶决策方法，通过将驾驶任务分解为三个操作并使用全连接神经网络训练各个策略，实现了在高速公路驾驶场景中平稳、安全的自动驾驶决策。

Jan, 2020

高效探索的层次化技能

本文介绍了一种新的分层技能学习框架，利用无监督学习获得不同复杂度的技能，并自动权衡技能的通用性和特定性，用于动态任务，并表明这种方法产生比现有方法更好的结果。

Oct, 2021

基于层次逆强化学习的交互式驾驶行为概率预测

讨论自动驾驶车辆如何通过基于层次逆强化学习的概率预测方法，准确预测周围车辆的行为并进行规划，以此应对人类行为的不确定性和交互作用。

Sep, 2018

自主驾驶中基于运动的无监督感知与预测

本文提出一种使用自学生成流技术的框架，自动学习行驶中的自由运动的物体，以替代在自主驾驶系统中昂贵的人工标注，实现更广泛、准确、自主的交通参与者识别和动作预测。

Oct, 2022

城市自主驾驶的动作和轨迹规划：层次强化学习

本论文提出了一种基于分层强化学习方法的行动和轨迹规划器，有效地解决了城市自动驾驶场景下的多任务多车辆决策问题，并通过在 CARLA 模拟器中进行广泛实验证明了其显著的性能提升。

Jun, 2023

基于参数化技能和先验知识的自动驾驶高效强化学习

ASAP-RL 提出了一种基于动作技能和专家先验知识的自动驾驶高效强化学习算法，旨在应对在复杂的拥堵道路条件下，传统驾驶策略难以扩展的问题。实验结果表明，相对于其他应用不同技能和先验知识的方法，该算法能够提高学习效率和驾驶性能。

May, 2023

使用无模型强化学习在密集交通中驾驶

本研究使用深度强化学习来生成一种连续控制规划方案，让自动驾驶汽车在拥挤的道路上实现车道变换，并与基于模型预测控制算法进行对比测试。

Sep, 2019