MT-VAE: 学习运动变换以生成多模式人体动力学
本文介绍了一种运用 VAE 和 Transformer-Based 架构实现人体运动序列的有条件生成,以及改进行为识别和降噪等两种应用。
Apr, 2021
本研究提出了一种新的深度生成模型,利用组合的全局和局部潜空间进行粗细粒度建模,独立于特定任务地学习复杂的人体运动,并在视频中基于人体姿态估计、运动捕捉系统中模拟完整的身体运动并进行可信的关键帧动画辅助。该通用的人体运动模型可以修复损坏的人体动画,从不完整的观察中生成完整的运动。
Jun, 2021
本文研究了基于 VQ-VAE 和 GPT 的人体运动生成的条件生成框架,并表明了通过常用的训练配方(EMA 和 Code Reset),我们可以获得高质量的离散表示。此外,我们在训练期间采用了一种简单的损坏策略来缓解训练 - 测试偏差,并在 HumanML3D 数据集上表现出比竞争方法更好的性能。
Jan, 2023
该篇论文介绍了如何使用基于数据驱动的生成模型,结合深度强化学习算法来实现基于多段运动捕捉数据的真实人体动作生成,并分析了 Motion VAEs 的局限性。
Mar, 2021
为了实现机器人与人类在共享环境中的无缝协作,准确预测未来的人类运动是必不可少的。本研究提出了 Adversarial Motion Transformer(AdvMT),通过整合基于 transformer 的运动编码器和时间连续性鉴别器,同时有效地捕捉了帧内的空间和时间依赖关系。在对抗训练的基础上,我们的方法有效减少了预测中的不良伪影,从而确保了学习更加真实和流畅的人类运动。评估结果表明,AdvMT 极大地提高了长期预测的准确性,同时也提供了稳健的短期预测。
Jan, 2024
本文提出了一种基于生物学启发的有条件时间变分自编码器(BI-CTVAE)的模型,用于连续学习涉及时间序列的任务,特别是人类运动,最终将其应用于生成运动序列的连续学习中,并在人类运动数据集上进行测试,结果分类准确率为 78%,比不使用重放模型高 63%,仅比离线训练最先进的 GRU 模型低 5.4%。
Nov, 2022
通过 Recurrent Transformers 和条件变分自编码器的结合,我们提出了一种新的迭代式方法,能够高效地生成具有任意动作序列的人类运动序列。该方法在 PROX 和 Charades 数据集上得到了验证,表明它在 FID 得分和语义一致性指标方面显著优于现有的技术方法。
Jun, 2022
研究逆向行动识别问题,以给定的预设行动类型为条件,通过采用 Lie Algebra 理论和时序变分自编码器(VAE)来生成 3D 的逼真的人体运动序列,并保持多样性,实验评估证明了方法的有效性。
Jul, 2020
该论文介绍了通过视频和 2D 关键点之间的跨模态潜在特征空间对三维人体运动和 2D 输入之间进行运动先验对齐的 Video-to-Motion Generator (VTM),该方法通过将运动数据分别建模为上半身和下半身,以及使用尺度不变的虚拟骨架与运动数据对齐,展示了在重建单目视频中的三维人体运动方面具有领先水平的表现,尤其是在未见过的视角和野外视频中的泛化能力。
Apr, 2024
本研究提出一种名为 MEVA 的基于自动编码器的运动压缩技术,将人类运动分解为平稳运动表示和通过运动细化学习的残差表示,从而捕捉人类运动的粗略整体动作和个人特定细节。实验结果表明,该方法产生了平稳和准确的 3D 人体姿态和运动估计。
Aug, 2020