Nov, 2023

高效 Transformer 的沙漏分词技术用于 3D 人体姿势估计

TL;DR提出了一种基于 Transformer 的 3D 人体姿态估计的剪枝和恢复框架,通过选择具有高语义多样性和消除视频帧冗余的少量代表性 Token,在中间 Transformer 块中有效地提高模型效率。