Feb, 2018

连续视频流中的事件检测和描述

TL;DRJEDDi-Net 是一种用于密集视频字幕生成的神经网络,它通过三维卷积层对输入视频流进行连续编码,并使用时间池化特征提出可变长度的时间事件,再生成它们的字幕。在大规模数据集上,JEDDi-Net 表现出了优异的性能。