Feb, 2024

无缝融合位置编码的人体动作组合

TL;DRFlowMDM 是第一个基于扩散的模型,它生成无需后处理或冗余去噪步骤的无缝人体运动组合。通过引入融合位置编码的技术,在绝对阶段恢复了全局运动连贯性,在相对阶段构建了平滑真实的过渡。FlowMDM 能够在 Babel 数据集上取得准确性、真实性和平滑度等方面的最新成果,并且在推理时仅使用每个动作序列的单个描述,通过其面向姿势的跨注意力机制使其对不同文本描述具有鲁棒性。最后,为了解决现有 HMC 度量的局限性,我们提出了两个新的度量指标:峰值加速度和加速度下的面积,以检测突变的转换。