Feb, 2024

PIP-Net:野外行人意图预测

TL;DR通过自动驾驶汽车实现精确的行人意图预测是当前研究中的挑战之一。本文介绍了 PIP-Net 框架,用于预测自动驾驶汽车在现实城市场景中行人过马路意图。该模型利用运动数据和驾驶场景的空间特征,采用一种基于循环和时间注意力的解决方案,优于当前最先进的模型。为了提高道路使用者的视觉表达以及它们与本车的距离,我们引入了一个分类深度特征图和一个局部运动流特征,提供对场景动态的丰富洞察力。此外,我们还探索了将视野从一个相机扩展到围绕本车的三个相机的影响,从而增强了模型的上下文感知能力。根据交通场景和道路环境的不同,该模型能够提前 4 秒准确预测行人过马路意图,这是当前行人意图预测研究的突破。最后,我们首次提出了 Urban-PIP 数据集,这是一个自动驾驶情景下的定制行人意图预测数据集,包含多相机注释。