学习从稀疏轨迹数据中模拟

KDDMar, 2021

Learning to Simulate on Sparse Trajectory Data

Hua Wei, Chacha Chen, Chang Liu, Guanjie Zheng, Zhenhui Li

TL;DRImInGAIL 框架通过结合数据插值和模仿学习的行为学习过程来解决从稀疏实际数据中学习模拟驾驶行为的问题，并在合成和实际驾驶车辆轨迹数据集上取得了优于其他基线方法和现有技术的表现。

Abstract

Simulation of the real-world traffic can be used to help validate the transportation policies. A good simulator means the simulated traffic is similar to real-world traffic, which often requires dense traffic trajectories (i.e., with a high sampling rate) to cover dynamic situations in the real world. However, in most cases, the real-world trajectories are s

traffic simulation dense trajectories data sparsity behavior learning imingail

发现论文，激发创造

TrafficSim：学习模拟真实多智体行为

利用 TrafficSim 模拟真实的自动驾驶系统中的多智能体交通模型，以更多样化的人类演示数据为基础，生成人类社交一致的行驶计划，生成更真实、更多样化的交通场景，可作为训练更好的运动规划员的有效数据增强。

Jan, 2021

逆强化学习驱动的面向目标的交通仿真

本研究使用参数共享对抗逆强化学习模型，将交通仿真视为一个逆强化学习问题，并且能够在实际环境中模拟出车辆轨迹，同时还能够恢复反映车辆真实目标的奖励函数，与现有方法相比，在多样化的实际交通环境中表现出卓越的性能和稳健性。

May, 2021

LASIL: 面向学习者感知的长期微观交通模拟的有监督模仿学习

本文介绍了一种称为学习者感知的监督式模仿学习模型，用于解决多智能体模仿学习中的协变量转移问题，通过利用变分自动编码器同时建模专家和学习者状态分布，在城市交通仿真中应用，展示了在真实数据集 pNEUMA 上在短期微观和长期宏观仿真中相较于现有 baselines 的显著改进。

Mar, 2024

利用生成对抗模仿学习生成城市车辆轨迹

该研究提出了一种基于生成对抗性模型（TrajGAIL）的机器学习方法，使用生成建模方法学习城市车辆轨迹数据的潜在分布，从而能够生成与实际车辆轨迹相似的合成轨迹来解决数据稀疏性或数据隐私问题，并在模拟和现实数据集中得到显著的性能提升。

Jul, 2020

TrajGen: 为自动驾驶生成现实和多样化的轨迹，并包含反应性和可行性的代理行为

本论文提出了一个用于自动驾驶性能验证的仿真器 TrajGen，该仿真器基于自然驾驶数据进行强化学习，可以直接从人类演示中捕捉更真实的行为，并生成可靠而多样的行动轨迹来评估仿真场景中的性能表现。

Mar, 2022

基于数据驱动的交通仿真：综述

自主驾驶车辆和数据驱动交通仿真的评估指标的综述与分析，探讨了自主驾驶车辆的性能验证挑战以及未来研究的方向。

Oct, 2023

城市交通量推断的稠密和不完整轨迹联合建模

本文提出了一种新的城市交通量推断框架，使用探测器和摄像头捕获到的密集 GPS 轨迹以及不完整轨迹，结合高保真交通模拟器和深度强化学习方法从不完整轨迹中恢复完整车辆行驶轨迹，并通过构建时空图和多视图图嵌入模型，推断未监测到的道路交通量。实验结果表明，该方法在中国省会城市的两个大区域中表现出了较高的准确性。

Feb, 2019

机器中的目的：交通模拟器是否能为强化学习应用程序产生分布等效的结果？

交通模拟器对于智能交通系统的学习数据生成起着重要作用。本研究通过对两种常用交通应用强化学习（RL）代理训练的模拟器 CityFlow 和 SUMO 进行控制实验，发现它们在 RL 相关度量指标上存在分布等效性的问题，暗示交通模拟器对 RL 训练并非万能解决方案。了解不同模拟器之间的差异对于训练和部署基于 RL 的智能交通系统至关重要。

Nov, 2023

从模拟中学习驾驶技能，无需真实世界标签

该论文研究基于模拟的无人驾驶视觉导航系统，探讨了如何通过图像转换实现域间转换并在农村和城市道路上对自闭车的驾驶性能进行评估。

Dec, 2018

逆强化学习与现实驾驶

利用学习规划和逆强化学习，本文通过一个轻量级和易于解释的安全过滤器来过滤生成的轨迹，使用一个得分模型对剩余轨迹进行评分，并使用最佳轨迹跟踪自动驾驶车辆的低级控制器。我们使用超过 500 小时的专家驾驶实例进行了实验验证，证明了我们的算法在高峰期的拉斯维加斯能够在各种复杂情况下实现完全自主驾驶的良好表现，并公开了该数据集以帮助未来的研究。

Jun, 2022