Sep, 2024

PoseEmbroider:朝向一种三维视觉语义感知的人体姿态表示

TL;DR本研究解决了现有方法在区分细致或不常见的人体姿态时的不足,提出了一种结合三维姿态、个体图像和文字描述的新型姿态表示方法。新模型采用基于变压器的架构,支持多模态输入,显著提高了信息整合能力,对细粒度指令生成和姿态回归任务具有重要影响。