关键词vision-language pretraining
搜索结果 - 19
- 面向视觉 - 语言模型的跨模态向后兼容表示学习PDFa month ago
- 自然语言有助于缩小 Sim2Real 鸿沟PDF2 months ago
- 深度学习表示的自监督视觉语言对骨 X 射线分析的对齐PDF2 months ago
- 增强图像检索:基于 CLIP 模型的照片搜索的全面研究PDF5 months ago
- 临床准确且可解释的双向字幕模型PDF8 months ago
- ICCVCTP: 基于兼容的动量对比和拓扑保持的视觉 - 语言持续预训练PDFa year ago
- DocumentCLIP:连结重排版文档中的图片与正文PDFa year ago
- 基于生成式文本引导的三维视觉语言预训练,用于统一医学图像分割PDFa year ago
- CVPRVILA:利用视觉语言预训练学习用户评论中的图像美学PDFa year ago
- CVPR使用自由语言建模加速视觉语言预训练PDFa year ago
- 加强上下文在区域词对齐中的作用以进行目标检测PDFa year ago
- AAAI使用单塔 Transformer 统一视觉与语言表示空间PDF2 years ago
- VL-CheckList:使用对象、属性和关系评估预训练的视觉语言模型PDF2 years ago
- MMGLIPv2: 统一定位和视觉语言理解PDF2 years ago
- ECCV视觉语言预训练的单流多级对齐PDF2 years ago
- CLIP-Event: 连接文本和图像的事件结构PDF2 years ago
- EMNLP视觉语言领域数据效率掩码语言建模PDF3 years ago
- ICLRSimVLM:简单的弱监督视觉语言模型预训练PDF3 years ago
- AAAI基于解耦式编码 - 解码网络的视觉 - 语言预训练中的定时采样PDF3 years ago
Prev
Next