Sep, 2017

电影故事理解的读写记忆网络

TL;DR我们提出了一种名为Read-Write记忆网络 (RWMN) 的新型记忆网络模型,用于大规模、多模态电影故事理解的问答任务。我们的RWMN模型的重点是设计读取网络和写入网络,由多个卷积层组成,从而使内存读取和写入操作具有高容量和灵活性。采用多层CNN的读写方式,更合理地表示顺序故事,从而实现了顺序存储的表达。我们应用模型到MovieQA基准测试的六个任务中,取得了最好的正确率,尤其是在视觉问答任务上。我们的模型表现出更好地理解故事中的内容,以及角色之间的关系和他们行动背后的原因的潜力。