ICCVDec, 2016

基于卷积神经网络的图像字幕语言的实证研究

TL;DR本研究介绍了一种基于卷积神经网络的语言模型,适用于统计语言建模任务,在图像字幕生成中表现出竞争性能。相比以前的模型,它使用所有先前的单词进行训练,可以模拟历史单词的长期依赖性,这对图像字幕生成至关重要。该方法在 MS COCO 和 Flickr30K 两个数据集上进行了验证,实验结果显示,相较于基于循环神经网络的语言模型表现更佳,且具有竞争性的最先进技术。