我们能否使用扩散概率模型进行三维运动预测？

Feb, 2023

我们能否使用扩散概率模型进行三维运动预测？

Can We Use Diffusion Probabilistic Models for 3D Motion Prediction?

Hyemin Ahn, Esteve Valls Mascaro, Dongheui Lee

TL;DR本研究评估了扩散概率模型在 3D 人体运动预测任务中的潜力。通过对人类 3.6M 和 HumanEva-I 数据集的研究，我们发现扩散概率模型可以在单个（确定性）和多个（随机性）3D 运动预测任务中具有竞争力，并且可以在单个训练过程完成后达到一个合理的预测结果，同时平衡对预测结果的可能性和多样性的需求。

Abstract

After many researchers observed fruitfulness from the recent diffusion probabilistic model, its effectiveness in image generation is actively studied these days. In this paper, our objective is to evaluate the potential of diffusion probabilistic models for →

diffusion probabilistic model image generation 3d human motion deterministic prediction stochastic prediction

发现论文，激发创造

随机运动预测的人体关节运动扩散细化

该研究提出了一种名为 MotionDiff 的扩散概率模型，将人体运动的运动学视为受热的粒子，其自原始状态扩散到噪声分布。该方法通过一种自然的方式获取了 “白化” 的潜在变量，而无需任何可训练参数，证明 MotionDiff 模型在两种数据集上具有竞争力的准确性和多样性表现。

Oct, 2022

基于运动扩散的全局一致随机人体动作预测

该论文提出了一种基于扩散的随机人体运动预测框架 DiffMotion，旨在预测未来的姿势序列，并通过使用多阶段图卷积网络和方差调度器，使预测结果准确、逼真、一致，同时在准确度和保真度方面明显优于先前的方法，并通过基准数据集展现了强大的鲁棒性。

May, 2023

利用去噪扩散概率模型统一人类动作合成和风格传递

本文提出了一种针对数字人运动合成的解决方案，使用 Denoising Diffusion Probabilistic Model 中的扩散模型和多任务架构来表示不同类别的动作内容和不同内部类别行为的样式，并使用对抗性和物理规则来实现全局引导。实验结果表明，该方法能够产生高质量、逼真的人体运动，并有效验证了多任务架构的有效性。

Dec, 2022

视频生成的扩散概率建模

本文提出了一种自回归、端到端优化的视频扩散模型，受到神经视频压缩技术的启发，可用于生成高质量的视频，并提出了可扩展的连续排名概率得分（CRPS）方法，以评估视频的概率预测能力，该方法在自然和仿真视频的多个数据集上比先前方法的感知质量和概率预测有着显著的提高。

Mar, 2022

TransFusion: 一种实用有效的基于 Transformer 的扩散模型，用于 3D 人体动作预测

TransFusion 是一种基于扩散的 3D 人体动作预测模型，它能够生成更有可能发生的样本并保持一定程度的多样性，通过使用 Transformer 作为骨干，以及在浅层和深层之间使用长跳连接和离散余弦变换来建模运动序列，改善性能，并与使用额外模块的先前基于扩散的模型相比，我们将所有输入（包括条件）都视为令牌，创造出比现有方法更精简的模型。我们对基准数据集进行了广泛的实验研究，以验证我们的人体动作预测模型的有效性。

Jul, 2023

针对风格化行走合成的去噪扩散概率模型

本文提出了一种使用去噪扩散概率模型（DDPM）生成风格化人体运动的框架，将两个任务集成到一个管道中，与传统运动合成方法相比，具有更高的风格多样性，实验结果表明，该系统可以生成高质量且多样化的行走动作。

Sep, 2022

运动规划扩散：使用扩散模型学习和规划机器人动作

学习轨迹分布的先验信息可以帮助加速机器人运动规划优化，本工作提出了学习扩散模型作为先验信息的方法，并通过扩散模型的逆去噪过程在任务目标条件下直接从后验轨迹分布中进行采样，实验证明扩散模型是编码高维机器人运动轨迹分布的强先验。

Aug, 2023

3D 控制合成运动人物

利用扩散模型为给定目标 3D 动作序列中的人物从单个图像创建动画的框架，包括学习关于人体和服装不可见部分的先验知识以及呈现适当的身体姿势和纹理的新姿态。

Jan, 2024

随机多人三维运动预测

该论文提出了一种新型的人类运动预测任务，针对多人运动、社交交互和关节运动的复杂性，提出了一种模型框架，通过引入可学习的潜在编码来表示未来动作的意图来实现不同层次的独立个体运动和社交交互建模，在多个数据集上得到了显著的多人预测结果，表现显著优于现有技术水平。

Jun, 2023

基于估计先验的加速扩散模型用于不确定性下鲁棒运动预测

我们提出了一种基于扩散的、可加速的框架，能够高效地预测代理的未来轨迹，具有对噪声的高抗干扰性，并满足自动驾驶车辆所需的严格实时操作标准。

May, 2024