关键词visual question answering
搜索结果 - 459
  • 实现统一的多模态推理框架
    PDF6 months ago
  • AAAI视觉问答中的物体属性重要性
    PDF7 months ago
  • 基于记忆增强的多线索推理的知识驱动视觉问答
    PDF7 months ago
  • VQA4CIR:用视觉问答提升组合图像检索
    PDF7 months ago
  • AAAI基于因果推理的图像内容生成
    PDF7 months ago
  • NuScenes-MQA:使用标记注释集成评估自动驾驶数据集的标题和问答
    PDF7 months ago
  • Causal-CoG: 基于因果效应的上下文生成对多模态语言模型的提升
    PDF7 months ago
  • 释放大型语言模型的潜力:洪水灾害场景下的无监督视觉问答(Zero-shot VQA)
    PDF7 months ago
  • 如何建立适合上下文内的序列用于视觉问答
    PDF7 months ago
  • 走向自顶向下推理:可解释的多代理视觉问答方法
    PDF7 months ago
  • 来自在线社区的完整真实视觉问答数据集
    PDF7 months ago
  • 属性多样性决定了 VQA 中的系统性差距
    PDF8 months ago
  • 针对基于语境的检索提问更多信息
    PDF8 months ago
  • 对基于知识的视觉问答模型 GPT-4V 的全面评估
    PDF8 months ago
  • 基于深度学习的视觉 - 语言任务统一框架
    PDF8 months ago
  • 基于视觉常识的异构图对比学习
    PDF8 months ago
  • VQA 模型中的注意力模式零 - shot 翻译为自然语言
    PDF8 months ago
  • 探索面向 VQA 的 GPT-4V 在零样本异常检测中的接地潜力
    PDF8 months ago
  • VQA-GEN: 一个面向领域泛化的视觉问答基准
    PDF8 months ago
  • 从图像到语言:对视觉问答(VQA)方法、挑战和机遇的关键分析
    PDF8 months ago