Apr, 2025
VideoPanda:基于多视角注意力的视频全景扩散
VideoPanda: Video Panoramic Diffusion with Multi-view Attention
TL;DR本研究解决了在虚拟现实中生成高分辨率全景视频内容的挑战,尤其是其收集过程复杂且需要专业设备。论文提出了一种新颖的VideoPanda方法,通过多视角注意力层增强视频扩散模型,实现了基于文本或单视角视频数据生成一致的多视角视频,并在生成更长视频时表现出良好的泛化能力。实验证明,与现有方法相比,VideoPanda在现实和合成视频数据集上生成的360°全景图像更为真实和连贯。