使用多智能体奖励增强模仿学习模拟人类驾驶行为的涌现特征

Mar, 2019

使用多智能体奖励增强模仿学习模拟人类驾驶行为的涌现特征

Simulating Emergent Properties of Human Driving Behavior Using Multi-Agent Reward Augmented Imitation Learning

Raunak P. Bhattacharyya, Derek J. Phillips, Changliu Liu, Jayesh K. Gupta, Katherine Driggs-Campbell...

TL;DR这篇论文提出了一种称为奖励增强模仿学习（RAIL）的方法，它在多智能体模仿学习框架中集成了奖励增强，并允许设计者以原则性的方式指定先前的知识，这种方法在驾驶场景中得到验证，并在复杂的多智能体设置中展示了单个智能体的局部行动和出现性质的行为方面的性能提高。

Abstract

Recent developments in multi-agent imitation learning have shown promising results for modeling the behavior of human drivers. However, it is challenging to capture emergent traffic behaviors that are observed in real-world datasets. Such behaviors arise due to the many local interacti

multi-agent imitation learning reward augmentation traffic behavior modeling driving policies convergence guarantees

发现论文，激发创造

通过生成式对抗模仿学习建模人类驾驶行为

本文提出一种通过学习真实世界中的驾驶示范数据来学习神经驾驶策略的方法，并使用广义博弈对抗模型进行智能驾驶行为生成，同时介绍了解决多智能体驾驶建模中存在的问题的多智能体模型，并描述了奖赏信号修正的 reward augmented imitation learning (RAIL) 和 Burn-InfoGAIL 对潜在变化因素进行解耦的方法。在 NGSIM 实验数据集上，成功地模拟了高速公路上的驾驶行为。

Jun, 2020

驾驶模拟的多智能体模仿学习

通过模拟驾驶场景来验证自主车辆的安全性，GAIL 可学习到具有代表性的人类驾驶模型，但在多主体驾驶情境中存在困难，我们通过基于课程学习的参数共享方法扩展 GAIL 以解决这些缺点，PS-GAIL 方法生成的策略在多主体设置下表现优异且能够捕捉人类驾驶员的紧急行为。

Mar, 2018

闭环中学习真实交通代理

使用闭环模拟学习方法 RTR，在模拟和真实数据集中训练交通仿真策略，以提高交通规则遵守性和仿真的真实性。

Nov, 2023

基于隐含机会的城市驾驶端到端无模型强化学习

本文采用一种叫 implicit affordances 的新技术，成功地通过强化学习算法完成了诸如车道保持，行人和车辆避让，以及红绿灯检测等复杂任务，最终在 CARLA 挑战赛中获胜。

Nov, 2019

城市环境中安全互动自主驾驶的想象增强分层强化学习方法

通过引入想象增强的分层强化学习算法，我们设计了一种新的导航算法，使得智能体能够在真实世界的导航任务中学习安全和交互的行为，提高了成功率并减少了平均步骤的数量。

Nov, 2023

CIMRL: 结合仿真与强化学习的安全自动驾驶

通过整合模仿学习和强化学习的方法，我们提出了一种能够在模拟环境中训练驾驶策略的框架，通过利用模仿运动先验和安全约束来改善纯克隆方法的闭环行为。结合强化学习和模仿学习，我们展示了我们的方法在闭环模拟驾驶基准测试中取得了最新的成果。

Jun, 2024

人类作为 AI 导师：提升自动驾驶的安全与效率的人机协同强化学习

通过引入人类作为人工智能导师 (HAIM)，提出了增强的人在回路中深度强化学习框架 (HAIM-DRL)，以确保自动驾驶在混合交通编队中的安全和高效。

Jan, 2024

利用人类反馈进行逼真交通模拟的强化学习

通过使用强化学习和人类偏好对齐，该研究旨在改善现有交通模型的模拟真实性，解决交通模拟模型的多样性和人类偏好的问题。该研究还提出了用于实现真实性对齐的数据集，并以 nuScenes 数据集的综合评估验证了 TrafficRLHF 框架在生成与人类偏好一致的逼真交通场景方面的能力。

Sep, 2023

TrafficSim：学习模拟真实多智体行为

利用 TrafficSim 模拟真实的自动驾驶系统中的多智能体交通模型，以更多样化的人类演示数据为基础，生成人类社交一致的行驶计划，生成更真实、更多样化的交通场景，可作为训练更好的运动规划员的有效数据增强。

Jan, 2021

情景感知交通规则例外的知情强化学习

应用有结构的规则书与情景感知奖励设计，我们引入了 Informed Reinforcement Learning，通过学习轨迹使代理能够学习需要控制交通规则例外的情况，并在自动驾驶领域中展示了高完成率。

Feb, 2024