ICLRMay, 2023

SlotDiffusion: 以扩散模型实现以物体为中心的生成建模

TL;DR本研究聚焦于提高物体图像生成的关键点到图像解码,为了达到高质量的视觉生成,提出了一种基于对象中心潜在扩散模型 SlotDiffusion,该模型在六个数据集上表现优异,并可用于现有的用于视频预测质量和下游时间推理任务的对象中心动力学模型,同时还展示了该模型和自监督预训练图像编码器在非约束性现实数据集上的可扩展性。