NIPSMay, 2015
多语种图像问答的数据集及方法:您正在与机器交流吗?
Are You Talking to a Machine? Dataset and Methods for Multilingual Image Question Answering
Haoyuan Gao, Junhua Mao, Jie Zhou, Zhiheng Huang, Lei Wang...
TL;DR本文介绍了基于 LSTM 和卷积神经网络的 mQA 模型,其可针对图像内容回答包括中英文在内的多语言问题,并使用 Freestyle Multilingual Image Question Answering (FM-IQA) 数据集进行评估,结果表明该模型在 64.7% 的情况下与人类回答无异,评分为 1.454。