Mar, 2024

行动再塑:动态人体行为的文本到姿态视频编辑

TL;DR我们介绍了一种新的文本到动作视频编辑方法ReimaginedAct,它可以预测视频中的人类动作变化,不仅可以接受直接指令文本提示,还可以通过假设性问题来预测可能的动作变化。该方法包括视频理解、推理和编辑模块,并引入了一个新的评估数据集WhatifVideo-1.0,实验证明与现有视频编辑方法相比,我们的方法可以实现有效的动作编辑,甚至可以根据假设性问题进行虚构编辑。