May, 2024

Dreamer XL:通过轨迹得分匹配实现高分辨率文本到 3D 生成

TL;DR该研究提出了一种新颖的轨迹分数匹配方法 (Trajectory Score Matching, TSM),旨在解决使用去噪扩散隐式模型 (Denoising Diffusion Implicit Models, DDIM) 反演过程中,Interval Score Matching (ISM) 由于累积误差导致的伪真值不一致问题。通过利用 DDIM 的反演过程计算相同起点的两条路径,TSM 可以减小与 ISM 相比的累积误差,从而缓解伪真值不一致问题。TSM 提高了模型在蒸馏过程中生成路径的稳定性和一致性,并实验证明 ISM 是 TSM 的特例。此外,为了优化从高分辨率文本到三维生成的多阶段优化过程,我们采用了稳定扩散 XL 进行指导。针对使用稳定扩散 XL 时由于不稳定梯度导致的异常复制和分裂问题,我们提出了一种逐像素梯度裁剪方法。广泛的实验证明我们的模型在视觉质量和性能方面显著超过了目前的最先进模型。