Aug, 2023

IP-Adapter:面向文本图像扩散模型的文本兼容图像提示适配器

TL;DRIP-Adapter 是一种有效且轻量级的适配器,通过分离交叉注意力层实现了预训练文本到图像扩散模型的图像提示能力,具有与完全微调的图像提示模型相媲美甚至更好的性能。利用分离的交叉注意力策略,图像提示可以与文本提示良好协作,实现多模态图像生成。