CVPRMar, 2022

StyleT2I: 面向复合和高保真的文本到图像合成

TL;DR本文提出了一种新的框架,StyleT2I,旨在改善文本到图像合成的组合性,并且使用 CLIP 引导的对比损失、语义匹配损失和空间约束等方法来识别属性的潜在方向,从而更好地解开属性的潜在表示,最终获得更好的合成图像的组合性。