BriefGPT.xyz
Ask
alpha
关键词
pretrained vision models
搜索结果 - 3
ICLR
通过预测分配来建立视觉和语言空间的桥梁
该论文介绍了 VLAP(pretrained vision models 和 large language models 之间的视觉理解的桥梁),通过一种新颖的方法,将预训练的视觉模型的嵌入空间转化为大规模语言模型的词嵌入空间,从而有效且通
→
PDF
3 months ago
CVPR
SeD: 图像超分辨率的语义感知鉴别器
我们提出了一种简单而有效的语义感知鉴别器,通过引入图像的语义作为条件,鉴别器能够个别且自适应地区分真实 - 伪造图像,从而引导超分辨网络学习细粒度的语义感知纹理,进而生成更照片般真实和令人愉悦的图像。
PDF
4 months ago
CVPR
使用现成模型集成 GAN 训练
利用预训练计算机视觉模型的嵌入向量的线性可分性来选择最准确的子集,并以渐进式添加到鉴别器合集中,可以显著提升 GAN 训练的性能,在有限数据和大规模设置下都表现良好。
PDF
3 years ago
Prev
Next