BriefGPT.xyz
Ask
alpha
关键词
text-video embeddings
搜索结果 - 2
ICCV
HowTo100M: 通过观看亿万叙述视频剪辑学习文本 - 视频嵌入
本文提出了使用具有自然语言注释的视频数据来学习文本 - 视频嵌入。我们介绍了 HowTo100M 数据集,该数据集包含了源自于 1.22 百万个讲解视频的 1.36 亿段视频剪辑,能够用于不同领域的学习,证明结果表明,该嵌入方式适用于不同的
→
PDF
5 years ago
从不完整和异构化数据中学习文本 - 视频嵌入
该研究提出了一种 Mixture-of-Embedding-Experts 模型,可以利用来自图像和视频数据集的数据源同时改进文本视频嵌入,解决了训练中缺失输入因素的难题,并在视频检索任务中表现出显著的改进和优越性能。
PDF
6 years ago
Prev
Next