- 矢量化表示梦想家(VRD):辅助多智能体运动预测
自主驾驶车辆的轨迹预测是一个关键问题,本文引入基于向量化世界模型的 VRD 方法,通过结合传统训练和新型训练流程,实现了多智能体运动预测的优异性能。
- DeTra:一个统一模型用于目标检测和轨迹预测
我们提出了一种名为 DeTra 的模型,它使用 LiDAR 点云和高清地图,通过轨迹精化的方式,直接推断对象的存在、姿态和多模态的未来行为,取得了在 Argoverse 2 Sensor 和 Waymo Open Dataset 上多个指标 - 离散潜在码的低秩适应轨迹预测
运用矢量量化变分自编码器(VQ-VAEs)和基于扩散的预测模型,通过离散潜在空间和实例级编码矢量的动态调整,实现轨迹预测的准确性和多样性,达到了三个标准基准测试的最新性能水平。
- CVPRHPNet:历史预测注意力下的动态轨迹预测
本论文介绍了一种新颖动态轨迹预测方法 HPNet,它利用历史帧包括地图和代理状态以及历史预测来稳定且准确地预测未来轨迹。经过 Argoverse 和 INTERACTION 数据集的实验证明,HPNet 取得了最先进的性能,并生成准确且稳定 - 层次光变换器集成用于多模态轨迹预测
我们提出了一种名为 HLT-Ens 的新方法,利用一种新的分层损失函数,通过组合的全连接层来捕捉多模态分布,有效地训练 Transformer 架构的集合,在轨迹预测技术上取得了最先进的性能水平,为改进轨迹预测技术提供了有希望的途径。
- CVPR在线地图不确定性的生成和应用于轨迹预测
高清地图在现代自动驾驶车辆的发展中起着重要作用,本文介绍了多种先进的在线地图估计方法,并扩展了不确定性预测,以更好地与轨迹预测结合,实验结果表明不确定性的引入可以提高训练收敛速度和预测性能。
- JRDB-Traj:人群轨迹预测数据集与基准
通过引入一个新的数据集和评估标准,这篇论文介绍了一种用于自主导航系统中轨迹预测的模型,旨在解决实际应用场景中隔离模型所面临的挑战,并促进对导航动态的深入理解。
- 自主驾驶的流式运动预测
基于连续数据流的轨迹预测是一个重要的问题,我们引入了一个新的基准测试来解决忽略了流数据中出现和消失的物体以及预测结果的时间连续性的问题,我们提出了一个名为 "预测流" 的算法来解决这个问题,并通过采用多模型轨迹传播和可微分滤波器来提高预测质 - 联合互动导航的扩散模型
通过 DJINN 扩散方法,本文在模拟自动驾驶系统中生成交通场景,改善实际情境收集的昂贵性,实现了目标轨迹预测中的最先进效果。同时展示了 DJINN 如何灵活地从各种有价值的条件分布中进行直接测试抽样,包括基于目标、行为类别和场景编辑等。
- 基于合成驾驶数据的轨迹预测预训练
在有限的数据可用性下,我们提出了利用高精度地图和轨迹的图表示以及预训练策略相结合的方法来学习通用的轨迹预测表示,进而对轨迹预测模型进行改进,从而在数据扩展和预训练策略方面取得了显著的效果。
- 基于上下文无关聚类的可靠、快速、准确的轨迹预测
提出多阶段概率预测路径的自主系统的新方法,包括轨迹转换、位移时间序列聚类、轨迹生成和排序建议,使用深度特征聚类方法进行分布偏移、使用新的基于距离的排序建议进行轨迹生成和分配概率,从而比传统方法更有效且准确地在人和道路代理的轨迹数据上实现上胜 - trajdata:多个人类轨迹数据集的统一接口
基于大规模真实人类轨迹数据集,该研究提出了 trajdata,以提供一个统一的界面和 API,用于训练和评估人类轨迹预测方法,从而加深对当前行人和自动驾驶运动预测研究的数据基础的理解,并提出了未来数据集的建议。
- 通过知识蒸馏提升无地图轨迹预测能力
本篇论文利用分层知识蒸馏框架,将基于高清地图的预测模型的知识迁移到不需要高清地图的预测模型中,提高了自主驾驶的轨迹预测准确性。
- Smooth-Trajectron++:使用平滑注意力增强 Trajectron++ 行为预测模型
该论文研究了一种基于 Trajectron ++ 的 Trajectory Forecasting 模型,并通过在其 Attendant 模块中加入平滑项来增强该模型的性能,该注意机制模仿人类关注的限制,将认知过程和机器学习模型整合起来,从 - CVPRV2X-Seq: 车辆基础设施合作感知和预测的大规模序列数据集
引入第一个大规模的连续 V2X 数据集 V2X-Seq,包括数据帧,轨迹,矢量地图和交通灯。基于该数据集,提出三个新的车辆基础设施协作自动驾驶任务:VIC3D 跟踪、在线和离线预测,并提供了这些任务的基准。
- 多路注意力交互建模
介绍了 Interaction Modeling with Multiplex Attention (IMMA) 方法,该方法能够准确地建模多智能体系统中代理之间的多种类型的相互作用,并利用渐进式层训练策略训练这种 d 听建筑,显示该方法在 - DIDER: 揭示可解释的动态演化关系
DIDER 是一个通用的端到端交互建模框架,其提供了内在的可解释性,通过将潜在的交互预测任务分解为子交互预测和持续时间估计,利用子交互类型在扩展时间范围内的一致性来实现内在的可解释性,实验结果表明,建模可解释动态关系可以提高轨迹预测任务的性 - ECCV认知历史:利用本地行为数据进行轨迹预测
本文介绍了一种新的行为方法来提高预测本地轨迹的准确性,该方法利用历史轨迹和地图数据,并分别采用基于历史数据和基于知识蒸馏的预测框架来应对数据不足的情况。通过实验,发现这种方法能比现有方法提高至少 14% 准确度。
- ECCV多模态车辆轨迹预测的分层潜在结构
利用层级潜在结构和车道级上下文向量,提升了变分自编码器在基于轨迹预测模型中的性能,生成复杂的多模态轨迹分布,并在预测准确度方面优于现有模型。
- PreTraM: 通过连接轨迹和地图的自监督预训练
该研究提出了一种基于预训练的深度学习模型 ——PreTraM,通过将轨迹和地图相连接来提高轨迹预测的准确性和数据利用率。PreTraM 比 AgentFormer 和 Trajectron 等基线方法在 nuScenes 数据集的 FDE-