关键词image question answering
搜索结果 - 4
- 使用动态参数预测的卷积神经网络进行图像问答
本研究通过使用卷积神经网络和动态参数层学习来解决图像问答问题,并使用门控循环单元的参数预测网络进行自适应参数预测,进而采用哈希技术降低问题规模。该算法在所有可用的公共图像问答基准测试中取得了最优性能。
- 用于图像问答的叠加注意力网络
本文提出了堆叠式注意力网络(SAN),通过自然语言问题分析图像,发现图像问答需要多层推理,于是我们开发了多层 SAN,通过可视化的注意力层,逐层推理以定位答案相关的视觉线索,实验证明 SAN 明显优于先前的最先进方法。
- AAAI使用卷积神经网络从图像中学习答案
本文提出使用卷积神经网络 (CNN) 解决图像问答 (QA) 问题,通过三个 CNN 模型来提升图像和问题共同表示的分类能力。经过 DAQUAR 和 COCO-QA 两个基准测试集的测试,本文的模型表现显著优于现有的最优解。
- NIPS多语种图像问答的数据集及方法:您正在与机器交流吗?
本文介绍了基于 LSTM 和卷积神经网络的 mQA 模型,其可针对图像内容回答包括中英文在内的多语言问题,并使用 Freestyle Multilingual Image Question Answering (FM-IQA) 数据集进行评