Nov, 2023

高效Transformer的沙漏分词技术用于3D人体姿势估计

TL;DR提出了一种基于Transformer的3D人体姿态估计的剪枝和恢复框架,通过选择具有高语义多样性和消除视频帧冗余的少量代表性Token,在中间Transformer块中有效地提高模型效率。