CVPRMar, 2022

3MASSIV:社交媒体短视频的多语言、多模态和多层面数据集

TL;DR3MASSIV 是一个多语言、多模态、多方面的专家标注数据集,由来自 Moj 短视频社交媒体平台的多样化短视频和 11 种不同语言的 100K 未标注视频组成,通过其独特的音频和视觉格式表达了流行的短视频趋势,介绍了 3MASSIV 并分析了其与强基线下其他现代流行数据集的不同之处,并展示了如何使用 3MASSIV 的社交媒体内容在语义理解任务和跨语言分析中应用。