May, 2024

多跳图变换网络用于3D人体姿势估计

TL;DR介绍了一个用于视频中2D到3D人体姿势估计的多跳图变换网络,通过利用多头自注意力和多跳图卷积网络的优势以捕获时空依赖关系和处理远距离交互,提出了一个模型架构来实现准确的全局和局部依赖关系捕捉以及处理所需的空间细节,实验结果表明其有效性和泛化能力。