ECCVSep, 2018

探究图像关系以用于图像描述

TL;DR本文介绍了一种利用图卷积网络和长短期记忆(GCN-LSTM)结构,将语义和空间对象关系集成到图像编码器中,以生成图像标题的新方法,并在 COCO 图像字幕数据集上开展了广泛的实验,并取得了比现有方法更好的结果。