Jan, 2024

ActAnywhere:主体感知视频背景生成

TL;DRActAnywhere 是一种生成式模型,可以自动调整与前景主体运动相吻合的视频背景,同时遵循艺术家的创意意图,通过使用大规模视频扩散模型进行训练,它可以根据前景主体分割的序列和描述所需场景的图像作为条件,生成具有真实的前景 - 背景交互并符合条件帧的连贯视频,在广泛的评估中表现出比基准模型显著优越的性能,且具有泛化到各种样本的能力,包括非人类主体。