Jun, 2023

高保真文本图像合成计数指导

TL;DR本研究提出了一种方法来改善文本到图像扩散模型,使其能够准确生成输入提示中所指定的物体数量,方法包括采用计数网络和引入注意力地图引导来获得物体的高保真度掩膜并通过计算梯度产生每个物体的去噪过程引导。