关键词vision-language pretraining
搜索结果 - 19
  • 面向视觉 - 语言模型的跨模态向后兼容表示学习
    PDFa month ago
  • 自然语言有助于缩小 Sim2Real 鸿沟
    PDF2 months ago
  • 深度学习表示的自监督视觉语言对骨 X 射线分析的对齐
    PDF2 months ago
  • 增强图像检索:基于 CLIP 模型的照片搜索的全面研究
    PDF5 months ago
  • 临床准确且可解释的双向字幕模型
    PDF8 months ago
  • ICCVCTP: 基于兼容的动量对比和拓扑保持的视觉 - 语言持续预训练
    PDFa year ago
  • DocumentCLIP:连结重排版文档中的图片与正文
    PDFa year ago
  • 基于生成式文本引导的三维视觉语言预训练,用于统一医学图像分割
    PDFa year ago
  • CVPRVILA:利用视觉语言预训练学习用户评论中的图像美学
    PDFa year ago
  • CVPR使用自由语言建模加速视觉语言预训练
    PDFa year ago
  • 加强上下文在区域词对齐中的作用以进行目标检测
    PDFa year ago
  • AAAI使用单塔 Transformer 统一视觉与语言表示空间
    PDF2 years ago
  • VL-CheckList:使用对象、属性和关系评估预训练的视觉语言模型
    PDF2 years ago
  • MMGLIPv2: 统一定位和视觉语言理解
    PDF2 years ago
  • ECCV视觉语言预训练的单流多级对齐
    PDF2 years ago
  • CLIP-Event: 连接文本和图像的事件结构
    PDF2 years ago
  • EMNLP视觉语言领域数据效率掩码语言建模
    PDF3 years ago
  • ICLRSimVLM:简单的弱监督视觉语言模型预训练
    PDF3 years ago
  • AAAI基于解耦式编码 - 解码网络的视觉 - 语言预训练中的定时采样
    PDF3 years ago
Prev
Next