EMNLPJul, 2017

OBJ2TEXT: 从物体布局生成视觉描述语言

TL;DROBJ2TEXT 是基于 LSTM 网络的序列到序列模型,可用于抽象场景的描述生成,加入状态 - 最先进的物体探测器后可将图像的描述评分从 0.863 提升到 0.950(CIDEr score),并能有效表示物体的空间关系。