Aug, 2018

上下文感知的视觉策略网络用于序列级图像描述

TL;DR该研究提出了一种上下文感知的可视策略(CAVP)神经网络,通过深度强化学习技术,能够有效的实现面向序列的图像描述。与传统的视觉注意力方法不同,CAVP可以在时间上应用复杂的视觉组合,并涵盖了先前的视觉关注上下文来推测当前的词生成过程,从而更好地捕捉图像中的视觉关系和比较,最终在 MS-COCO 数据集上表现出了最先进的性能。