Nov, 2023

零样本引导图像合成的分层渲染扩散模型

TL;DR本文介绍了增强依赖于文本查询的扩散模型的空间可控性的创新解决方案,提出了两个关键创新:视觉引导和分层渲染扩散(LRDiff)框架。该方法通过视觉引导和分层渲染策略实现更高效和准确的图像综合,用于满足特定的空间和上下文需求,并通过实验证明其在定量和定性上优于现有技术。