BriefGPT.xyz
Ask
alpha
关键词
multi-modal person identification
搜索结果 - 1
iQIYI-VID: 一个大规模的多模态人物识别数据集
本文引入了 iQIYI-VID 数据集,它是用于多模式人物识别的最大视频数据集,由 600K 个 5,000 名名人的视频剪辑组成,这些视频来自于各种类型的在线视频。通过实验结果表明,多模态注意模块融合的多模态特征可以显著提高人物识别的准确
→
PDF
6 years ago
Prev
Next