学习从稀疏轨迹数据中模拟
利用 TrafficSim 模拟真实的自动驾驶系统中的多智能体交通模型,以更多样化的人类演示数据为基础,生成人类社交一致的行驶计划,生成更真实、更多样化的交通场景,可作为训练更好的运动规划员的有效数据增强。
Jan, 2021
本研究使用参数共享对抗逆强化学习模型,将交通仿真视为一个逆强化学习问题,并且能够在实际环境中模拟出车辆轨迹,同时还能够恢复反映车辆真实目标的奖励函数,与现有方法相比,在多样化的实际交通环境中表现出卓越的性能和稳健性。
May, 2021
本文介绍了一种称为学习者感知的监督式模仿学习模型,用于解决多智能体模仿学习中的协变量转移问题,通过利用变分自动编码器同时建模专家和学习者状态分布,在城市交通仿真中应用,展示了在真实数据集 pNEUMA 上在短期微观和长期宏观仿真中相较于现有 baselines 的显著改进。
Mar, 2024
该研究提出了一种基于生成对抗性模型(TrajGAIL)的机器学习方法,使用生成建模方法学习城市车辆轨迹数据的潜在分布,从而能够生成与实际车辆轨迹相似的合成轨迹来解决数据稀疏性或数据隐私问题,并在模拟和现实数据集中得到显著的性能提升。
Jul, 2020
本论文提出了一个用于自动驾驶性能验证的仿真器 TrajGen,该仿真器基于自然驾驶数据进行强化学习,可以直接从人类演示中捕捉更真实的行为,并生成可靠而多样的行动轨迹来评估仿真场景中的性能表现。
Mar, 2022
本文提出了一种新的城市交通量推断框架,使用探测器和摄像头捕获到的密集 GPS 轨迹以及不完整轨迹,结合高保真交通模拟器和深度强化学习方法从不完整轨迹中恢复完整车辆行驶轨迹,并通过构建时空图和多视图图嵌入模型,推断未监测到的道路交通量。实验结果表明,该方法在中国省会城市的两个大区域中表现出了较高的准确性。
Feb, 2019
交通模拟器对于智能交通系统的学习数据生成起着重要作用。本研究通过对两种常用交通应用强化学习(RL)代理训练的模拟器 CityFlow 和 SUMO 进行控制实验,发现它们在 RL 相关度量指标上存在分布等效性的问题,暗示交通模拟器对 RL 训练并非万能解决方案。了解不同模拟器之间的差异对于训练和部署基于 RL 的智能交通系统至关重要。
Nov, 2023
利用学习规划和逆强化学习,本文通过一个轻量级和易于解释的安全过滤器来过滤生成的轨迹,使用一个得分模型对剩余轨迹进行评分,并使用最佳轨迹跟踪自动驾驶车辆的低级控制器。我们使用超过 500 小时的专家驾驶实例进行了实验验证,证明了我们的算法在高峰期的拉斯维加斯能够在各种复杂情况下实现完全自主驾驶的良好表现,并公开了该数据集以帮助未来的研究。
Jun, 2022