Jun, 2023

扩散中的扩散:循环单向扩散用于文本 - 视觉 - 有条件生成

TL;DR本文介绍了一种基于文本语义和像素级视觉条件同时进行的图像合成多模式方法及其框架(COW),通过诸如 COW 的方法,可以解决已有方法不能在保留低级视觉的情况下实现文本到图像合成的问题。