NIPSMay, 2015

多语种图像问答的数据集及方法:您正在与机器交流吗?

TL;DR本文介绍了基于 LSTM 和卷积神经网络的 mQA 模型,其可针对图像内容回答包括中英文在内的多语言问题,并使用 Freestyle Multilingual Image Question Answering (FM-IQA) 数据集进行评估,结果表明该模型在 64.7% 的情况下与人类回答无异,评分为 1.454。