Aug, 2017
从确定性到生成性:用多模态随机循环神经网络实现视频字幕生成
From Deterministic to Generative: Multi-Modal Stochastic RNNs for Video Captioning
Jingkuan Song, Yuyu Guo, Lianli Gao, Xuelong Li, Alan Hanjalic...
TL;DR本文提出了一种基于多模态随机递归神经网络(MS-RNN)的生成式视频字幕方法,利用基于拉丁超立方采样(LHS)的随机采样方法解决给定视频的不确定性问题,支持不同的句子生成,实验结果显示该方法优于现有技术,并提高了视频字幕的性能。