关键词vision-language
搜索结果 - 49
- 视觉语言预训练数据压缩PDFa year ago
- ConES:用于参数高效调整大型视觉语言模型的概念嵌入搜索PDFa year ago
- 探索多样的上下文配置进行图像字幕生成PDFa year ago
- Musketeer (All for One, and One for All): 具有任务解释提示的通用视觉语言模型PDFa year ago
- 跨语言模型传递视觉提示生成器PDFa year ago
- CVPRIFSeg:基于视觉语言模型的无图像语义分割PDFa year ago
- 面向视觉语言模型的 Patch-Token 对齐的贝叶斯提示学习PDFa year ago
- ICLRHiCLIP: 基于分层感知注意力的对比语言 - 图像预训练PDFa year ago
- UniAdapter:跨模态建模的统一参数高效迁移学习PDFa year ago
- ACL基于证据的自动事实检查中的图像阅读和推理PDFa year ago
- 用更少的双模态监督训练视觉 - 语言模型PDF2 years ago
- 细粒度语义对齐视觉 - 语言预训练PDF2 years ago
- ECCV基于视觉 - 语言提示的零样本时序动作检测PDF2 years ago
- AAAIBridgeTower: 视觉 - 语言表示学习中编码器之间桥梁的构建PDF2 years ago
- MixGen:一种新型多模态数据增强方法PDF2 years ago
- 骨干部分融合的粗到精视觉 - 语言预训练PDF2 years ago
- VL-BEiT: 生成式视觉 - 语言预训练PDF2 years ago
- 通过跨模态跳跃连接实现有效和高效的视觉 - 语言学习的 mPLUGPDF2 years ago
- 利用单模编码器进行视觉语言任务的多模适应蒸馏PDF2 years ago
- 无监督视觉 - 语言解析:通过依赖关系无缝桥接视觉场景图与语言结构PDF2 years ago