CVPRMar, 2023
自由式布局图像合成
Freestyle Layout-to-Image Synthesis
Han Xue, Zhiwu Huang, Qianru Sun, Li Song, Wenjun Zhang
TL;DR本文研究了一种名为 Freestyle LIS 的无限制生成模型,并通过引入 Rectified Cross-Attention 模块,集成语义掩码,成功实现了从具体布局以及大规模预训练文本 - 图像扩散模型中广泛的文本知识,生成现实的、灵活的布局到图像的生成结果。