BriefGPT.xyz
Ask
alpha
关键词
visual questions
搜索结果 - 5
AAAI
基于检测的视觉问答中间监督
采用检测为基础的中间监督方法(DIS)来提供更全面和准确的中间监督,从而提升了回答推理性问题的性能,并通过考虑中间结果来增强了回答复合问题及其子问题的一致性。
PDF
6 months ago
弱监督视觉问答生成
本文提出一种弱监督视觉问答生成方法,从视觉信息和字幕中合成问答对,使用 ViLBERT 模型对其进行微调,实验结果在 VQA 数据集上表现显著优于其他先进技术。
PDF
a year ago
CVPR
以视觉问题作为监督形式:一个问题中包含了什么
本文研究了利用视觉问题对图像进行弱监督的方法,提出了两种简单但有效的修改标准视觉问答模型的方法,并展示了基于这些方法的数据增强策略在标准 VQA 基准测试上的 7.1% 改进。
PDF
7 years ago
视觉和文本问答的动态记忆网络
本文通过分析动态记忆网络并提出多项改进,包括一种新的图像输入模块,实现在缺乏支持事实的情况下回答问题,该新型 DMN + 模型成功应用于视觉问答数据集和文本问答数据集上,且无需支持事实监督。
PDF
8 years ago
CVPR
视觉问答的焦点区域:何处寻找
本文提出一种方法,通过选择与基于文本的查询相关的图像区域来学习回答视觉问题。该方法在回答 ' 什么颜色 ' 等需要评估特定位置以及 ' 什么房间 ' 等需要选择性地识别信息图像区域的问题方面展示出显著的提升。我们的模型在 VQA 数据集上进
→
PDF
9 years ago
Prev
Next