Jan, 2024
太一扩散・记者:运用大型视觉语言模型推进双语文本到图像生成
Taiyi-Diffusion-XL: Advancing Bilingual Text-to-Image Generation with Large Vision-Language Model Support
Xiaojun Wu, Dixiang Zhang, Ruyi Gan, Junyu Lu, Ziwei Wu...
TL;DR通过扩展 CLIP 和 Stable-Diffusion-XL 的能力,我们开发了一种新的中英双语文本到图像模型 Taiyi-Diffusion-XL,该模型在中英双语图文检索和图像生成方面都表现优异,填补了开源模型领域中对双语或中文支持的重要缺口。