BriefGPT.xyz
Ask
alpha
关键词
howto100m dataset
搜索结果 - 2
CVPR
从未经筛选的教育视频中的视觉表示端到端学习
本文介绍了一种新的学习方法,MIL-NCE, 用于从讲述视频中学习强大的视频表示,并能够在不需要手动注释的情况下进行。该方法通过对齐不对称的讲述视频,有效地学习了视频表示。作者在 HMDB-51、UCF-101、Kinetics-700 等
→
PDF
5 years ago
ICCV
HowTo100M: 通过观看亿万叙述视频剪辑学习文本 - 视频嵌入
本文提出了使用具有自然语言注释的视频数据来学习文本 - 视频嵌入。我们介绍了 HowTo100M 数据集,该数据集包含了源自于 1.22 百万个讲解视频的 1.36 亿段视频剪辑,能够用于不同领域的学习,证明结果表明,该嵌入方式适用于不同的
→
PDF
5 years ago
Prev
Next