BriefGPT.xyz
Feb, 2024
使用ControlNet和交叉注意控制实现基于局部描述的布局到图像生成
Layout-to-Image Generation with Localized Descriptions using ControlNet with Cross-Attention Control
HTML
PDF
Denis Lukovnikov, Asja Fischer
TL;DR
通过修改跨注意力矩阵,在保持图像质量的同时改进控制能力,本研究以 ControlNet 为例,研究了几种现有的跨注意力控制方法的局限性,并提出了一种新的跨注意力操纵方法,通过定位描述来实现对生成图像的精细控制。
Abstract
While
text-to-image diffusion models
can generate highquality images from textual descriptions, they generally lack fine-grained control over the
visual composition
of the generated images. Some recent works tack
→