关键词clip model
搜索结果 - 78
  • 少即是多:去除文本区域提高 CLIP 训练效率和鲁棒性
    PDFa year ago
  • HyperStyle3D: 通过超网络进行文本引导的 3D 人像风格化
    PDFa year ago
  • SemEval2023 任务 1 中的 OPI: 面向视觉词义消歧的图像 - 文本嵌入和多模态信息检索
    PDFa year ago
  • CVPRCLIP 引导的视觉 - 语言预训练用于 3D 场景问答
    PDFa year ago
  • ICLRUnicom: 用于图像检索的通用紧凑表示学习
    PDFa year ago
  • CVPR无监督文本到图像生成的变分分布学习
    PDFa year ago
  • 对比学习是基于相似度图的谱聚类
    PDFa year ago
  • 语言图像预训练的 Sigmoid Loss
    PDFa year ago
  • CVPRWinCLIP:零 / 少样本异常分类和分割
    PDFa year ago
  • CVPR正向增量对比学习在图像和视频字幕评估中的应用
    PDFa year ago
  • Paparazzi:深入探究语言和视觉模型在观点描述中的能力
    PDFa year ago
  • GALIP: 文本到图像生成的生成对抗 CLIPs
    PDFa year ago
  • 重新审视基于 CLIP 的图像到视频知识传递的时间建模
    PDFa year ago
  • FICE: 带引导 GAN 反演的文本调制时尚图像编辑
    PDFa year ago
  • 在像素级别释放视觉提示的威力
    PDF2 years ago
  • AAAI面向边缘设备的高效图像字幕生成
    PDF2 years ago
  • AAAIVASR: 情境识别的视觉类比
    PDF2 years ago
  • CVPR优化过的 CLIP 模型是高效的视频学习器
    PDF2 years ago
  • CVPR文本生成图像的移位扩散
    PDF2 years ago
  • 检索增强的多模态语言建模
    PDF2 years ago