关键词vqa
搜索结果 - 45
  • 关于视觉定位在 VQA 中的作用
    PDF6 days ago
  • 有选择性地回答视觉问题
    PDFa month ago
  • CVPRPTM-VQA: 从各个方面利用多样化的预训练模型来进行高效视频质量评估
    PDFa month ago
  • CuMo:多模态 LLM 与协同升级混合专家的扩展
    PDF2 months ago
  • 增强的视觉问答:卷积的比较分析与文本特征提取
    PDF2 months ago
  • 学习定位对象提高视觉语言模型的空间推理能力
    PDF3 months ago
  • 揭示 VQA 中视觉定位方法的全部潜力
    PDF6 months ago
  • 通过一个大型语言模型的一系列问答,将目前基于合成问题的视觉问答普及到人工书写的问题
    PDF6 months ago
  • AAAI通过仅文本训练挖掘细粒度的图像 - 文本对齐用于零样本字幕生成
    PDF6 months ago
  • 上下文感知的目的明确视觉问答
    PDFa year ago
  • 图像上叠加文本的视觉问答(VQA)
    PDFa year ago
  • 揭示视觉问答中交叉模态偏见:基于可能世界的因果视角 VQA 分析
    PDFa year ago
  • 联合学习问答器和密集字幕生成器强化视觉语言预训练
    PDFa year ago
  • 基于 SPSA 梯度的量子机器学习优化器实证比较
    PDFa year ago
  • CVPRMixPHM: 针对低资源视觉问答的冗余感知、参数高效调整
    PDFa year ago
  • 系统性归纳的简要调查
    PDF2 years ago
  • ECCV重新思考数据增强对于强健的视觉问答的影响
    PDF2 years ago
  • IJCAI基于声明的提示调整技术用于视觉问答
    PDF2 years ago
  • ACLVQA 可能只需要图片标题
    PDF2 years ago
  • CVPRSimVQA: 探索模拟环境进行视觉问答
    PDF2 years ago
Prev