Dec, 2023

增强扩散模型与3D透视几何约束

TL;DR通过引入新的几何约束条件在生成模型的训练过程中强制进行透视准确性的要求,我们展示了使用该约束条件训练的生成模型的输出既更加逼真,同时还提高了在生成图像上进行训练的下游模型的性能。主观人类实验表明,使用我们约束条件训练的潜在扩散模型生成的图像在70%的情况下优于 Stable Diffusion V2 模型生成的图像。我们的图像微调后的 SOTA 单眼深度估计模型如 DPT 和 PixelFormer 在 KITTI 测试集上的零-shot 转移中 RMSE 上超过真实图像训练的原始模型最多 7.03%,SqRel 上超过 19.3%。