Jan, 2025
扩散作为着色器:具备3D感知的视频扩散以实现多样化视频生成控制
Diffusion as Shader: 3D-aware Video Diffusion for Versatile Video
Generation Control
TL;DR本文解决了视频生成过程中对生成控制的精确需求,尤其是在摄像机操作和内容编辑方面的挑战。提出的“扩散作为着色器”(DaS)方法通过使用3D跟踪视频作为控制输入,实现了多个视频控制任务的统一架构,从而提升了视频生成的灵活性和时间一致性。研究表明,DaS在不同任务(如网格到视频生成、摄像机控制、运动转移和物体操控)中展现出卓越的控制能力。