Dec, 2023

提升三维人体姿势估计的鲁棒性:一个基准和从嘈杂输入中学习

TL;DR当前的 3D 人体姿势估计技术虽然表现出色,但在复杂的野外视频中理解和提升它们的普适性仍然是一个开放的问题。本文聚焦于 2D 到 3D 姿势提升器的稳健性,并开发了两个基准数据集来检验视频 - based 3D 姿势提升器对包括临时遮挡、动态模糊和像素级噪声在内的一系列常见视频污染的稳健性。我们观察到现有的最先进的 3D 姿势提升器在存在污染的情况下的普适性较差,并提出了两种应对这一问题的技术。首先,我们引入了时间加性高斯噪声 (TAGN) 作为一种简单而有效的 2D 输入姿势数据增强技术。此外,为了将 2D 姿势检测器输出的置信度得分纳入考虑,我们设计了一种置信度感知的卷积 (CA-Conv) 块。通过在受损视频上广泛测试,所提出的策略不断提升了 3D 姿势提升器的稳健性,并为未来研究建立了新的基准。