Jun, 2024

连贯的零射视觉指令生成

TL;DR该论文提出了一种简单的、无需训练的框架,通过整合文本理解和图像生成,解决了在生成视觉指令中保持物体的一致性和平滑状态转换的问题,实验证明该方法可以生成一致且具有视觉吸引力的指令。