BriefGPT.xyz
大模型
Ask
alpha
关键词
visual attribute prompts
搜索结果 - 2
视觉 - 语言模型的多模态特征提示
我们提出了一种多模态属性提示方法(MAP),通过同时探索文本属性提示、视觉属性提示和属性级对齐来解决大规模预训练视觉 - 语言模型(VLMs)在少样本情况下的一些局限性,实验结果表明我们的方法在 11 个数据集上表现优于现有方法。
PDF
4 months ago
通过多重视觉策略引导强化学习学习有利可图的 NFT 图像扩散
本文提出了一种基于扩散模型的 NFT 图像生成框架 Diffusion-MVP,该框架使用多个视觉策略作为奖励,包含多样化的视觉稀有度、视觉美学评分和基于 CLIP 的文本 - 图像相关性。实验结果表明我们的框架生成的 NFT 图像较之现有
→
PDF
a year ago
Prev
Next