CVPRMar, 2023

自由式布局图像合成

TL;DR本文研究了一种名为 Freestyle LIS 的无限制生成模型,并通过引入 Rectified Cross-Attention 模块,集成语义掩码,成功实现了从具体布局以及大规模预训练文本 - 图像扩散模型中广泛的文本知识,生成现实的、灵活的布局到图像的生成结果。