Mar, 2024

桥接不同的语言模型和生成视觉模型用于文本到图像生成

TL;DR通过整合进阶的语言模型和生成式视觉模型,本研究提出了LaVi-Bridge管道,用于实现文本到图像的生成,证明这种整合可以显著改进文本对齐和图像质量等性能。