Nov, 2016

递归内存寻址描述视频

TL;DR本文提出了Key-Value Memory Networks应用于多模态设置的方法,以及一种新的键寻址机制,将视频字幕生成问题自然地分解为视觉和语言端,将其作为键-值对处理,并在寻址模式下提出了一种递归关注的方法来捕捉语境信息,通过实验发现,这种方法可以提高BLEU@4,METEOR得分,并实现了与最先进方法竞争性能。