Apr, 2024
MaxFusion: 文本 - 图像扩散模型中的即插即用多模态生成
MaxFusion: Plug&Play Multi-Modal Generation in Text-to-Image Diffusion Models
Nithin Gopalakrishnan Nair, Jeya Maria Jose Valanarasu, Vishal M Patel
TL;DR本研究提出了一种名为 MaxFusion 的新策略,通过合并多个模型的对齐特征,为扩展到新模态条件的基于文本到图像生成模型提供了一个高效的伸缩方法。