运动程序的分层运动理解

CVPRApr, 2021

Hierarchical Motion Understanding via Motion Programs

Sumith Kulal, Jiayuan Mao, Alex Aiken, Jiajun Wu

TL;DR本研究提出了运动编程，一种表示运动的高级抽象，包括基于视频的自动诱导和视频合成的系统，可用于改善下游的运动分析任务，并对视频插值和预测等下游任务产生积极影响，同时能够检测各种重复的动态方式并促进交互式视频编辑。

Abstract

Current approaches to video analysis of human motion focus on raw pixels or keypoints as the basic units of reasoning. We posit that adding higher-level →

video analysis human motion motion primitives neuro-symbolic motion programs

发现论文，激发创造

人类运动描述和合成的程序化概念学习

介绍了程序化动作概念，该概念以层次化的方式表示人类动作，捕捉低级运动和高级描述作为运动概念，并能够在一个框架中实现人类动作描述、交互式编辑和新的视频序列受控合成。以半监督方式从配对视频和动作序列中学习该概念表示的体系结构，并演示了该框架在多个应用中的高效性和有效性，尤其是在小数据范围内优于已建立的基线方法，通过紧凑的表述，也可以提供低资源训练配方，以实现数据效率学习。

Jun, 2022

通过模块化运动程序进行动作问答

我们提出了一个名为 HumanMotionQA 的任务来评估模型在长形式人体运动序列上的复杂多步推理能力，同时提出了一种名为 NSPose 的神经符号方法。该方法使用符号推理和模块化设计通过学习运动概念、属性神经算子和时间关系来地面运动。我们演示了 NSPose 在 HumanMotionQA 任务上的适用性，优于所有基线方法。

May, 2023

随心所欲：具有层次语义图的运动扩散模型细粒度控制

提出了一种利用分层语义图实现对人体运动生成的细粒度控制的方法，通过将运动描述分解成三个层次的语义图，从整体到局部的结构帮助全面理解运动描述和对运动生成进行细粒度控制，并对分解的文本到运动扩散过程进行了优化，通过修改分层语义图的边权重，实现了生成运动的持续细化，具有超过基准数据集 HumanML3D 和 KIT 的优越性能。

Nov, 2023

通过程序生成探索人类计划的层次结构

人类的行为具有层次性，通过将任务分解为子任务或将抽象行为分解为具体行为而产生。本文通过观察人们生成具有明确层次结构的行动序列的程序，探究人们如何形成层次结构的计划，并发现人类在计划时对效用最大化和最小描述长度两个指标敏感，但同时具有超越最小描述长度的重用性偏好，可以通过将最小描述长度模型扩展为对程序的生成模型来解释。此模型可以最好地预测人类行为，突出了指导层次规划的原则。

Nov, 2023

分层神经程序合成

本文提出了一种可扩展的程序合成框架，通过层级组合程序实现程序合成，该框架可以从输入 / 输出对中合成比之前更长、更复杂的程序，并通过任务嵌入空间和程序解码器将任务嵌入解码为程序。

Mar, 2023

通过运动动作语义桥接人类运动和行动情景

运动理解的目标是建立动作语义与运动之间的可靠映射关系，通过使用运动的客观动力学事实作为中介，我们可以统一运动知识库并构建一个运动理解系统，这也激发了运动生成的新型自动基准测试。

Oct, 2023

多樣視頻演示生成程序

本文介绍一种可以从视频演示中提取概括性规则的模型，并探讨了其处理多个序列的能力，从而相较于传统的概括技术可以更好地利用边缘情况，并无需进行额外的过滤。通过在 Vizdoom 环境中合成程序的实验，取得了相对于现有工作的 11.75% 的程序准确性的提升。

Feb, 2023

基于分层样式网络的动作合成

本文提出了一种自我监督的方法来生成多样且自然的人体动作，通过分解生成任务并使用记忆库检索动作引用作为短程片段生成的源材料，并通过参数化的双向插值方案保证了生成运动的物理合理性和视觉自然性。在大规模的骨架数据集上，我们展示了这个方法在生成长距离、多样化和合理化运动方面的能力，并且这种方法能够适应未见数据，在动态世界中这种生成的序列有实实在在的效果。

Aug, 2020

可编程开放式运动控制任务的动作生成

在实际场景中的字符动画需要各种约束条件，如轨迹、关键帧、互动等。我们提出了一种可编程的运动生成新范式，通过将运动控制任务分解为原子约束的组合，并将其编程到误差函数中，实现生成满足约束的运动序列，以此解决动作控制的开集问题。实验证明在处理一系列未知任务时，我们能够生成高质量的运动。这些任务包括运动动力学、几何约束、物理定律、场景、物体或角色自身部位的相互作用等，且无需收集特定的训练数据或设计特殊的网络结构。同时，我们观察到新的技能在编程新任务时的涌现，还利用大型语言模型实现了自动编程。我们希望这项工作能为通用人工智能代理的运动控制铺平道路。

May, 2024

运动数据有效的无监督时序分割

我们介绍了一种基于自相似结构的自动化时间分割人体运动数据的方法，并使用邻域图将运动基元聚类成更大的语义实体，实现了完全无监督的分割和分析运动数据的能力。

Oct, 2015