AAAINov, 2022

基于单目摄像机和单线激光雷达的大规模场景弱监督三维多人姿态估计

TL;DR本文提出了一种基于单目摄像头和单个 LiDAR 的方法,用于大规模场景下的 3D 多人姿态估计。通过设计一种有效的多模态融合策略,并充分利用时间信息来指导网络学习自然和连贯的人类运动,以点云的固有几何约束为自我监督,用图像上的 2D 特征点进行弱监督,无需依赖于任何 3D 姿态注释。实验结果表明了该方法的优越性和泛化能力。