BriefGPT.xyz
大模型
Ask
alpha
关键词
image prompt
搜索结果 - 2
IP-Adapter:面向文本图像扩散模型的文本兼容图像提示适配器
IP-Adapter 是一种有效且轻量级的适配器,通过分离交叉注意力层实现了预训练文本到图像扩散模型的图像提示能力,具有与完全微调的图像提示模型相媲美甚至更好的性能。利用分离的交叉注意力策略,图像提示可以与文本提示良好协作,实现多模态图像生
→
PDF
a year ago
LLM-grounded Diffusion: 借助大型语言模型增强文本到图像扩散模型中的提示理解
该论文介绍了一种使用预训练大型语言模型对扩散模型进行增强推理能力的方法,包括两个阶段:第一阶段使用大型语言模型生成场景布局;第二阶段使用一个新的控制器,来生成与布局条件相符的图像。实验结果表明,该方法能更准确地生成需要语言和空间推理的图像。
PDF
a year ago
Prev
Next