Mar, 2017

用于情境识别的循环模型

TL;DR本文提出使用递归神经网络模型来预测结构化的“图像情境”,进一步研究了行为和名词实体在动作相关的语义角色中的作用,并且创新性地使用了专门的动作预测网络,以及一个 RNN 来进行名词预测。相比于之前使用条件随机场的工作,我们的系统在最近的imSitu数据集上获得了最佳的准确性表现,并且将从情景预测中学习到的特征转移到图像字幕生成任务中,以便更准确地描述人-物互动。