Dec, 2023

基于交叉注意力引导的多视角无监督图像生成

TL;DR利用预训练的无监督自监督视觉变换器(DINOv2)对单类别数据集进行聚类,从而识别物体姿势,并带有训练在姿势标签上的姿势条件扩散模型,同时在推断时利用跨帧注意力以确保视角的一致性,进一步通过强化注意力指导提高,从而在实际图像上实现了优越于先前工作的新视角合成的模型 MIRAGE,同时在以预训练的稳定扩散生成的合成图像上进行的实验显示 MIRAGE 对于多样的纹理和几何具有鲁棒性。