Feb, 2024

Boximator: 生成富有丰富和可控的动作用于视频合成

TL;DRBoximator 是一种新的视频合成方法,通过引入硬盒和软盒两种约束类型,在条件帧中选择目标物体并在未来帧中粗略或严格定义其位置、形状或运动路径,以实现丰富且可控的运动;在训练过程中,通过冻结原始权重并仅训练控制模块,保持基础模型的知识;通过引入一种新颖的自我追踪技术,大大简化了目标物体与盒子的相关性学习;实验证明,Boximator 在视频质量和运动可控性上均取得了最先进的结果,并经过引入盒子约束进一步提升,用户评估结果也表明用户喜欢 Boximator 的生成结果。