Jun, 2024

基于语义图注意网络和距离信息的 3D 全身姿态估计

TL;DR我们开发了一种新颖的语义图注意力网络,它能够从自注意力捕获全局上下文的能力中受益,同时利用图卷积来处理骨架的局部连通性和结构约束。我们还设计了一个身体部分解码器,用于提取和改进与身体特定部分相关的信息。此外,我们的方法还包含距离信息,增强了模型理解和准确预测空间关系的能力。最后,我们引入了一种几何损失,对身体的结构骨架施加了关键约束,以确保模型的预测符合人体姿势的自然限制。实验证明了我们方法的有效性,表明系统中的每个元素对提高姿势估计结果至关重要。与最先进方法相比,我们的工作不仅达到了现有基准,而且超过了现有基准。