BriefGPT.xyz
Ask
alpha
关键词
c3d
搜索结果 - 3
CVPR
2020 VATEX 视频字幕挑战赛 NITS-VC 系统
本文介绍了用于视频字幕挑战的框架,采用编码器 - 解码器的方法,其中使用 3D 卷积神经网络对视频进行编码,并使用两个 LSTM 递归网络进行解码,最终输出是两个 LSTM 的输出元素乘积,而此模型可以在公共和私人测试数据集上实现 BLEU
→
PDF
4 years ago
CVPR
通过预测动态和外观统计信息进行视频自监督时空表示学习
在没有人工标注标签的前提下,本文提出了一种自我监督学习方法来学习视频的时空特征,通过回归时空维度上的外观和运动统计量来提取视觉特征,并在视频分类任务中验证了其有效性。
PDF
5 years ago
使用三维卷积神经网络学习时空特征
通过在大规模监督视频数据集上使用训练的深度三维卷积神经网络(3D ConvNets)提出了一种简单而有效的时空特征学习方法。我们的成果有三个:1)相对于 2D ConvNets,3D ConvNets 更适用于时空特征学习;2)所有层中具有
→
PDF
10 years ago
Prev
Next