COLINGOct, 2016

从音素到图像:一种循环神经模型中的表征层次结构,用于视觉语言学习

TL;DR基于堆叠门控循环神经网络的视觉语言学习模型,可以通过音素序列描述的图像描述,学习预测图像的视觉特征,并以层级结构表示语言信息。