BriefGPT.xyz
大模型
Ask
alpha
关键词
uniclip
搜索结果 - 1
CBVS:面向现实世界短视频搜索场景的大规模中文图文基准
利用大规模图像文本预训练的视觉语言模型在图像检索等任务中表现出优异性能;为了填补短视频封面数据的缺失,我们建立了首个面向中文短视频搜索场景的大规模封面文本基准测试集,并提出了 UniCLIP 方法,通过训练时的封面文本引导,但推理时不依赖封
→
PDF
5 months ago
Prev
Next