Nov, 2016

结合多种线索的视觉 Madlibs 问题回答

TL;DR本论文提出一种从视觉 Madlibs 数据集回答填空多项选择题的方法,通过使用针对特定任务训练的网络的组合,结合特征提取的空间支持,将每个特征与候选答案映射到联合嵌入空间并解决优化问题,以学习组合来自多个提示的 CCA 模型的分数以选择最佳答案。实验结果表明,与现有技术相比,本方法取得了显著的改进,且在处理各种问题类型时,使用各种图像提示并仔细选择特征提取的空间支持有益。