BriefGPT.xyz
大模型
Ask
alpha
关键词
clip2video
搜索结果 - 1
CLIP2Video: 通过 Image CLIP 掌握视频文本检索
CLIP2Video 网络通过将图像语言预训练模型转移到视频文本检索,采用端到端方式,区别于领先的视频和语言学习方法的多模态交互,我们利用预训练的图像语言模型,进一步简化为两个具体阶段的框架,使其能够在相对较少的数据集上进行训练,并通过 T
→
PDF
3 years ago
Prev
Next