我们能否使用扩散概率模型进行三维运动预测?
该研究提出了一种名为 MotionDiff 的扩散概率模型,将人体运动的运动学视为受热的粒子,其自原始状态扩散到噪声分布。该方法通过一种自然的方式获取了 “白化” 的潜在变量,而无需任何可训练参数,证明 MotionDiff 模型在两种数据集上具有竞争力的准确性和多样性表现。
Oct, 2022
该论文提出了一种基于扩散的随机人体运动预测框架 DiffMotion,旨在预测未来的姿势序列,并通过使用多阶段图卷积网络和方差调度器,使预测结果准确、逼真、一致,同时在准确度和保真度方面明显优于先前的方法,并通过基准数据集展现了强大的鲁棒性。
May, 2023
本文提出了一种针对数字人运动合成的解决方案,使用 Denoising Diffusion Probabilistic Model 中的扩散模型和多任务架构来表示不同类别的动作内容和不同内部类别行为的样式,并使用对抗性和物理规则来实现全局引导。实验结果表明,该方法能够产生高质量、逼真的人体运动,并有效验证了多任务架构的有效性。
Dec, 2022
本文提出了一种自回归、端到端优化的视频扩散模型,受到神经视频压缩技术的启发,可用于生成高质量的视频,并提出了可扩展的连续排名概率得分(CRPS)方法,以评估视频的概率预测能力,该方法在自然和仿真视频的多个数据集上比先前方法的感知质量和概率预测有着显著的提高。
Mar, 2022
TransFusion 是一种基于扩散的 3D 人体动作预测模型,它能够生成更有可能发生的样本并保持一定程度的多样性,通过使用 Transformer 作为骨干,以及在浅层和深层之间使用长跳连接和离散余弦变换来建模运动序列,改善性能,并与使用额外模块的先前基于扩散的模型相比,我们将所有输入(包括条件)都视为令牌,创造出比现有方法更精简的模型。我们对基准数据集进行了广泛的实验研究,以验证我们的人体动作预测模型的有效性。
Jul, 2023
本文提出了一种使用去噪扩散概率模型(DDPM)生成风格化人体运动的框架,将两个任务集成到一个管道中,与传统运动合成方法相比,具有更高的风格多样性,实验结果表明,该系统可以生成高质量且多样化的行走动作。
Sep, 2022
学习轨迹分布的先验信息可以帮助加速机器人运动规划优化,本工作提出了学习扩散模型作为先验信息的方法,并通过扩散模型的逆去噪过程在任务目标条件下直接从后验轨迹分布中进行采样,实验证明扩散模型是编码高维机器人运动轨迹分布的强先验。
Aug, 2023
该论文提出了一种新型的人类运动预测任务,针对多人运动、社交交互和关节运动的复杂性,提出了一种模型框架,通过引入可学习的潜在编码来表示未来动作的意图来实现不同层次的独立个体运动和社交交互建模,在多个数据集上得到了显著的多人预测结果,表现显著优于现有技术水平。
Jun, 2023
我们提出了一种基于扩散的、可加速的框架,能够高效地预测代理的未来轨迹,具有对噪声的高抗干扰性,并满足自动驾驶车辆所需的严格实时操作标准。
May, 2024