Nov, 2018

iQIYI-VID: 一个大规模的多模态人物识别数据集

TL;DR本文引入了 iQIYI-VID 数据集,它是用于多模式人物识别的最大视频数据集,由 600K 个 5,000 名名人的视频剪辑组成,这些视频来自于各种类型的在线视频。通过实验结果表明,多模态注意模块融合的多模态特征可以显著提高人物识别的准确性。