Feb, 2024

透明图像层扩散的潜在透明度

TL;DR我们提出了 LayerDiffusion 方法,使得大规模预训练潜在扩散模型能够生成透明图像。该方法通过将 alpha 通道透明度编码到预训练潜在扩散模型的潜在流形中,学习了 “潜在透明度”。通过调整潜在空间并微调预训练模型,可以将任何潜在扩散模型转换为透明图像生成器。我们通过人机协作收集 1M 个透明图像层对来训练该模型,并展示了潜在透明度在不同开源图像生成器和条件控制系统中的应用。用户研究发现,在大多数情况下(97%),用户更喜欢我们本地生成的透明内容,而不是之前的临时解决方案,如生成和镶嵌。用户还报告称我们生成的透明图像的质量可与 Adobe Stock 等真实商业透明资产相媲美。