Apr, 2022

ParkPredict+: 基于 CNN 和 Transformer 的停车场车辆多模态意图和运动预测

TL;DR该研究使用卷积神经网络和 Transformer 网络从轨迹历史记录和卫星图像中提取时间空间和语境信息,对停车场中人驱动车辆的多模态意图和轨迹预测问题进行了研究,并提出了一种新的方法,能够更精确地预测多个模态,并编码复杂的多智能体场景,同时能够适应不同的停车地图。为了训练和评估方法,该研究还介绍了一组公开的 4K 视频数据集,其中包括了准确的注释、高帧率和丰富的交通场景。