May, 2024

PT43D:基于单一高度模糊 RGB 图像生成三维形状的概率变换器

TL;DR提出了一种基于 Transformer 的自回归模型,根据可能以高度模糊的观测图像为基础的 RGB 图像,生成 3D 形状的概率分布,该模型采用交叉注意力机制,有效地识别形状生成的最相关兴趣区域,并在合成数据和真实数据上得到优于现有方法的结果。