May, 2024

VividDream: 生成带有环境动力学的 3D 场景

TL;DR用单一的输入图像或文本提示生成可以探索的带有环境动态的 4D 场景的方法。通过迭代修复和几何融合将输入图像扩展为静态的 3D 点云,然后使用质量细化技术并以从采样的相机轨迹渲染的静态 3D 场景为条件,生成带有动态视频集合的动画视频集合。最终优化包含动画视频集合的规范化 4D 场景表示,使用每个视频的运动嵌入和可见性蒙版来减轻不一致性,从而实现 3D 场景的自由视角探索,并且实验证明 VividDream 可以根据不同的真实图像和文本提示为人类观众提供引人入胜的 4D 体验。