Jun, 2024

奇幻世界:从单张图像生成交互式3D场景

TL;DRWonderWorld是一个新颖的交互式3D场景推断框架,基于单个输入图像和用户指定的文本,用户能够探索和构建虚拟环境。通过利用快速高斯Surfels和引导式扩散深度估计方法,WonderWorld能够在显著减少计算时间的同时生成几何一致的推断结果。我们的框架使用单个A6000 GPU在不到10秒钟内生成连接且多样化的3D场景,实现了实时用户交互和探索。这一方法在交互式3D场景生成方面取得了重要进展,为用户驱动的内容创作和虚拟环境中的探索开辟了新的可能性。我们将发布完整的代码和软件以进行可复现性。项目网站:https://this-website-url