Aug, 2017

从确定性到生成性:用多模态随机循环神经网络实现视频字幕生成

TL;DR本文提出了一种基于多模态随机递归神经网络(MS-RNN)的生成式视频字幕方法,利用基于拉丁超立方采样(LHS)的随机采样方法解决给定视频的不确定性问题,支持不同的句子生成,实验结果显示该方法优于现有技术,并提高了视频字幕的性能。