CVPRJun, 2017

针对 YouTube-8M 数据集的多标签视频分类的视频和标签先验编码

TL;DR本文介绍了针对 YouTube-8M 数据集进行多标签视频分类的深度神经网络模型,包括帧编码器、分类层、标签处理层和损失函数,并讨论了现有模型在该数据集上的效果及其成功或失败的原因,所提出的模型的大部分性能都高于基线模型,并且最终的模型集合在 Kaggle 比赛中排名第 8。