Nov, 2023

自校正的LLM控制扩散模型

TL;DR使用Self-correcting LLM-controlled Diffusion (SLD)框架,该研究提出了一种迭代闭环过程,能够根据输入的提示生成图像、评估其与提示的对齐性,并纠正生成图像中的不准确性,从而提高文本到图像生成的正确性。该研究还发现,通过调整LLM的指令,SLD可以执行图像编辑任务,弥合文本到图像生成与图像编辑流程之间的差距。