关键词vision-language tasks
搜索结果 - 25
  • 基于 LLM 的层次化概念分解方法用于可解释的细粒度图像分类
    PDFa month ago
  • 引入路由功能以低秩瓶颈优化视觉语言参数高效微调
    PDF4 months ago
  • 双重焦点:在多模态大型语言模型中整合宏观和微观视角
    PDF4 months ago
  • 通用粗细视觉语言模型设计:万能任务大师
    PDF6 months ago
  • AAAI值得信赖的视觉语言模型的探险:一项调查
    PDF7 months ago
  • 大型多模态模型的持续指令调优
    PDF7 months ago
  • EMNLP为视觉问答填补图像信息缺口:引导大规模语言模型主动提问
    PDF7 months ago
  • 复杂视觉语言推理任务中的思维链路作用
    PDF8 months ago
  • 动态编码器早期退出的加速编码 - 解码 Transformer 模型
    PDF8 months ago
  • GPT-4V 作为视觉语言任务的通用评估器
    PDF8 months ago
  • MiniGPT-v2:大型语言模型作为视觉语言多任务学习的统一接口
    PDF9 months ago
  • 重新表述、增强、推理:视觉定位问题与视觉 - 语言模型的关联
    PDF9 months ago
  • 通过语义基础解决视觉语言任务中目标提议评估的不匹配
    PDF10 months ago
  • ACLUniFine: 一种用于零样本视觉 - 语言理解的统一和细粒度方法
    PDFa year ago
  • 通过动态视觉提示将预训练语言模型应用于视觉语言任务
    PDFa year ago
  • GRILL: 基于文本和图像区域对齐的视觉 - 语言预训练
    PDFa year ago
  • 扩散模型中基于上下文的学习解锁
    PDFa year ago
  • CVPR自上而下的分析合成视觉注意力
    PDFa year ago
  • GIT: 用于视觉和语言的生成图像到文本的变压器
    PDF2 years ago
  • CLIP-TD:针对视觉语言任务的 CLIP 目标蒸馏
    PDF2 years ago
Prev