Apr, 2022

ViTPose: 用于人体姿势估计的简单视觉 Transformer 基线模型

TL;DR本文通过一个名为 ViTPose 的基础模型展示了纯视觉 Transformer 在姿态估计任务中的潜力,该模型结构简单、可扩展、训练方式灵活,并在多关键点检测中取得了优异的性能,其中大模型最高精度达到当前最佳水平。