语言驱动的交互式交通轨迹生成
提出了一种 CTG++ 基于学习的交通流模型,它可以通过语言指令进行指导,从而解决了交通模型控制需要领域专业知识,对实践者使用困难等问题,通过经过广泛的评估,我们展示了该方法在生成实际且符合查询要求的交通仿真方面的有效性。
Jun, 2023
该研究论文介绍了一种名为 LCTGen 的模型,它结合了大型语言模型和基于变压器的解码器架构,利用语言作为动态交通场景生成的监督来源,其在无条件和条件下的交通场景生成方面表现优于之前的研究,并且在现实感和保真度方面更好。
Jul, 2023
自动驾驶中,理解车辆与周围环境的社交互动行为并预测其轨迹的能力对道路安全至关重要。为了克服神经网络方法在车辆轨迹预测中缺乏可解释性的问题,本文结合离散选择模型的可解释性与神经网络模型的高准确性,提出了一种能解释其预测结果而不降低准确度的模型,并通过使用 INTERACTION 数据集进行实现和评估,证明了该模型的有效性。
Aug, 2023
通过离散序列建模方法,我们研究了自动驾驶开发中模拟基于记录驾驶日志的动态驾驶场景的挑战。使用简单的数据驱动分词方案,将轨迹离散化到厘米级分辨率,并采用类似 GPT 模型的编码器 - 解码器来建模车辆、行人和骑车人在驾驶场景中的互动。通过在模型中抽样场景,我们展示了该模型具有最先进的真实性,且在 Waymo Sim Agents Benchmark 上超越先前的工作,其中真实性值成功提高了 3.3%,与其他模型相比,互动度提高了 9.9%。我们还在完全自动驾驶和部分自动驾驶环境中分析了我们的建模选择,并展示了我们的模型学到的表示可以快速适用于改进 nuScenes 的性能。此外,我们还对模型的参数数量和数据集规模进行了可扩展性评估,并利用模型得出的密度估计量化了上下文长度和时间间隔内交互对于交通建模任务的重要性。
Dec, 2023
该研究提出了一个灵活的基于语言的框架,使用自然语言输入和场景图像处理机器人运动指令,通过预先训练的语言模型和变压器编码器网络生成目标几何特征,然后使用变压器解码器生成轨迹,无需任何先验知识。在复杂环境下,仿真和实际实验表明,该系统可以成功地跟随人类意图,修改轨迹的形状和速度。
Aug, 2022
在本研究中,我们提出了 ChatTraffic,这是一个将文本转化为交通场景的扩散模型,通过结合生成模型和描述交通系统的文本,解决了交通预测方法在异常事件敏感性和长期预测性能方面的挑战。通过结合图卷积网络和扩散模型以提取交通数据的空间相关性,并构建了一个大型的文本 - 交通数据集,实验证明 ChatTraffic 能够从文本生成逼真的交通场景。
Nov, 2023
本论文提出了一个用于自动驾驶性能验证的仿真器 TrajGen,该仿真器基于自然驾驶数据进行强化学习,可以直接从人类演示中捕捉更真实的行为,并生成可靠而多样的行动轨迹来评估仿真场景中的性能表现。
Mar, 2022
本文提出了一种基于自然语言的灵活性极高的人机协作接口,将大型语言模型 (BERT 和 CLIP) 的优势与轨迹信息相结合,通过多模态注意力变换实现对用户命令的编码,并将其与轨迹信息相结合。在包含机器人轨迹的数据集上进行模仿学习,并将轨迹生成过程视为序列预测问题,通过仿真轨迹实验和真实机器人实验验证了该系统的效果优异,并证明了自然语言接口在人机协作中的优越性。
Mar, 2022
我们提倡自然语言驱动(NLD)模拟来高效地生成虚拟道路场景中多个物体之间的交互,以教学和测试自主驾驶系统。NLD 模拟使用简洁的自然语言描述来控制物体之间的交互,并显著减少了创建大量交互数据的人力成本。为了促进 NLD 模拟的研究,我们收集了包含 12 万个自然语言描述的语言到交互(L2I)基准数据集,描述了 6 种常见道路拓扑中物体之间的交互。每个描述都与编程代码相关联,图形渲染器可以使用该代码在虚拟场景中进行可视化重现。作为一种方法学贡献,我们设计了 SimCopilot 来将交互描述转化为可渲染的代码。我们使用 L2I 数据集评估 SimCopilot 在控制物体运动、生成复杂交互和在不同道路拓扑之间推广交互方面的能力。L2I 数据集和评估结果激发了相关自然语言驱动模拟的研究。
Dec, 2023