Mar, 2018

多任务强化学习的端到端视频字幕生成

TL;DR该论文提出了一种多任务强化学习的方法,用于训练端到端视频字幕生成模型,其主要思想是从人工字幕视频中挖掘并构建尽可能多的有效任务,以共同调节端到端神经网络的搜索空间,并得到泛化的视频字幕生成模型。实验结果表明,这种模型在两个基准视频字幕数据集上的表现都大大优于现有方法。