Oct, 2024

DiffPano:可扩展且一致的基于文本的全景生成方法

TL;DR本研究针对3D场景和360度图像生成面临的场景数据集不足、场景复杂性高和多视角一致性难题,提出了一种新的全景生成框架DiffPano。该框架通过建立大规模全景视频-文本数据集并利用稳定扩散的生成能力,精细调优了单视角文本到全景的扩散模型,从而实现可扩展且多样化的全景图像生成,实验结果表明其在给定的新文本描述和相机姿态下能够生成一致且多样的全景图像。