关键词visual question answering
搜索结果 - 459
- 实现统一的多模态推理框架PDF6 months ago
- AAAI视觉问答中的物体属性重要性PDF7 months ago
- 基于记忆增强的多线索推理的知识驱动视觉问答PDF7 months ago
- VQA4CIR:用视觉问答提升组合图像检索PDF7 months ago
- AAAI基于因果推理的图像内容生成PDF7 months ago
- NuScenes-MQA:使用标记注释集成评估自动驾驶数据集的标题和问答PDF7 months ago
- Causal-CoG: 基于因果效应的上下文生成对多模态语言模型的提升PDF7 months ago
- 释放大型语言模型的潜力:洪水灾害场景下的无监督视觉问答(Zero-shot VQA)PDF7 months ago
- 如何建立适合上下文内的序列用于视觉问答PDF7 months ago
- 走向自顶向下推理:可解释的多代理视觉问答方法PDF7 months ago
- 来自在线社区的完整真实视觉问答数据集PDF7 months ago
- 属性多样性决定了 VQA 中的系统性差距PDF8 months ago
- 针对基于语境的检索提问更多信息PDF8 months ago
- 对基于知识的视觉问答模型 GPT-4V 的全面评估PDF8 months ago
- 基于深度学习的视觉 - 语言任务统一框架PDF8 months ago
- 基于视觉常识的异构图对比学习PDF8 months ago
- VQA 模型中的注意力模式零 - shot 翻译为自然语言PDF8 months ago
- 探索面向 VQA 的 GPT-4V 在零样本异常检测中的接地潜力PDF8 months ago
- VQA-GEN: 一个面向领域泛化的视觉问答基准PDF8 months ago
- 从图像到语言:对视觉问答(VQA)方法、挑战和机遇的关键分析PDF8 months ago