CVPRApr, 2024

驯服文本到 360° 全景图像生成的稳定扩散

TL;DR通过双分支扩散模型 PanFusion,从文本提示生成 360 度全景图像,并使用投影感知的独特交叉注意机制提供协作降噪过程中的最小畸变。