BriefGPT.xyz
Ask
alpha
关键词
textual prompt tuning
搜索结果 - 2
盲人视觉 - 语言一致性引导的多模态提示学习用于 AI 生成图像质量评估
提出了一种基于视觉 - 语言一致性指导的多模态提示学习方法,称为 CLIP-AGIQA,用于盲目的 AI 生成图像质量评估,该方法在两个公共 AGIQA 数据集上的实验结果表明其优于现有的质量评估模型。
PDF
12 days ago
VPA:完全测试时间的视觉提示适应
通过引入可学习的标记,VPA(Visual Prompt Adaptation)作为一个框架通过测试时间的自适应实现了视觉提示的普遍性,且不需要源领域信息,实验结果表明 VPA 有效提高了各种模型的历程泛化、抗干扰性和领域适应能力,以及对视
→
PDF
9 months ago
Prev
Next