ICCVApr, 2021

无几何先验的视图合成:Transformer 技术

TL;DR本文研究了利用卷积神经网络需要显式的 3D 偏置模型来模拟立体几何变换,而相比之下,使用基于变换器的模型可以在不需要手动设计 3D 偏置的情况下,通过全局注意机制和概率形式隐式地学习源视图和目标视图之间的长距离 3D 对应关系来生成全新视图,克服了先前方法面对相对较小的视角变化的限制。实验表明,不需要几何先验知识时,变换器仍能隐式地学习 3D 之间的关系,并且在视觉质量方面优于现有技术。