Mar, 2023

X&Fuse: 文字图像生成中的视觉信息融合

TL;DR介绍了一种能够在生成图像时根据视觉信息进行条件控制的通用方法 X&Fuse,其在三种不同的文本图像生成场景中展现了其潜力:通过召回与相关图像有关的图像(Retrieve&Fuse),利用被剪裁对象图像进行主体驱动生成(Crop&Fuse),和直接访问图像场景(Scene&Fuse),同样有效。