关键词vision-language tasks
搜索结果 - 25
- 基于 LLM 的层次化概念分解方法用于可解释的细粒度图像分类PDFa month ago
- 引入路由功能以低秩瓶颈优化视觉语言参数高效微调PDF4 months ago
- 双重焦点:在多模态大型语言模型中整合宏观和微观视角PDF4 months ago
- 通用粗细视觉语言模型设计:万能任务大师PDF7 months ago
- AAAI值得信赖的视觉语言模型的探险:一项调查PDF7 months ago
- 大型多模态模型的持续指令调优PDF7 months ago
- EMNLP为视觉问答填补图像信息缺口:引导大规模语言模型主动提问PDF8 months ago
- 复杂视觉语言推理任务中的思维链路作用PDF8 months ago
- 动态编码器早期退出的加速编码 - 解码 Transformer 模型PDF8 months ago
- GPT-4V 作为视觉语言任务的通用评估器PDF8 months ago
- MiniGPT-v2:大型语言模型作为视觉语言多任务学习的统一接口PDF9 months ago
- 重新表述、增强、推理:视觉定位问题与视觉 - 语言模型的关联PDF9 months ago
- 通过语义基础解决视觉语言任务中目标提议评估的不匹配PDF10 months ago
- ACLUniFine: 一种用于零样本视觉 - 语言理解的统一和细粒度方法PDFa year ago
- 通过动态视觉提示将预训练语言模型应用于视觉语言任务PDFa year ago
- GRILL: 基于文本和图像区域对齐的视觉 - 语言预训练PDFa year ago
- 扩散模型中基于上下文的学习解锁PDFa year ago
- CVPR自上而下的分析合成视觉注意力PDFa year ago
- GIT: 用于视觉和语言的生成图像到文本的变压器PDF2 years ago
- CLIP-TD:针对视觉语言任务的 CLIP 目标蒸馏PDF2 years ago
Prev