CVPRApr, 2024

研究跨注意力对解锁零 - shot 编辑的文本到视频扩散模型的效果

TL;DR最新的图像和视频扩散模型在内容创作方面取得了显著进展,为定制生成内容提供了大量技术。本文首次研究了跨注意力在零样本视频编辑中的作用,展示了在 T2V 模型中实现对物体形状、位置和运动的控制的潜力。