ICCVNov, 2019

电影问答:我们是否在问正确的问题?

TL;DR本研究探讨电影问答数据集中存在的语言偏见,提出一个简单的模型,通过合适的词向量训练,能够在不考虑视频和字幕等故事情境的情况下,通过观察问题和答案来回答约一半的问题。与排行榜上发表的最佳论文相比,我们的简单问题 + 答案模型在视频 + 字幕类别精度提高了 5%,在字幕、DVS 和剧本方面精度更是提高了 15%,这表明使用适当的词向量训练能够大大提高问答准确度。