visual questions | BriefGPT

关键词visual questions

搜索结果 - 5

AAAI基于检测的视觉问答中间监督
采用检测为基础的中间监督方法（DIS）来提供更全面和准确的中间监督，从而提升了回答推理性问题的性能，并通过考虑中间结果来增强了回答复合问题及其子问题的一致性。
PDF6 months ago
弱监督视觉问答生成
本文提出一种弱监督视觉问答生成方法，从视觉信息和字幕中合成问答对，使用 ViLBERT 模型对其进行微调，实验结果在 VQA 数据集上表现显著优于其他先进技术。
PDFa year ago
CVPR以视觉问题作为监督形式：一个问题中包含了什么
本文研究了利用视觉问题对图像进行弱监督的方法，提出了两种简单但有效的修改标准视觉问答模型的方法，并展示了基于这些方法的数据增强策略在标准 VQA 基准测试上的 7.1％改进。
PDF7 years ago
视觉和文本问答的动态记忆网络
本文通过分析动态记忆网络并提出多项改进，包括一种新的图像输入模块，实现在缺乏支持事实的情况下回答问题，该新型 DMN + 模型成功应用于视觉问答数据集和文本问答数据集上，且无需支持事实监督。
PDF8 years ago
CVPR视觉问答的焦点区域：何处寻找
本文提出一种方法，通过选择与基于文本的查询相关的图像区域来学习回答视觉问题。该方法在回答 ' 什么颜色 ' 等需要评估特定位置以及 ' 什么房间 ' 等需要选择性地识别信息图像区域的问题方面展示出显著的提升。我们的模型在 VQA 数据集上进
PDF9 years ago