BriefGPT.xyz
Ask
alpha
关键词
semantic video embeddings
搜索结果 - 1
VideoPrism:一种用于视频理解的基础视觉编码器
介绍了一种名为 VideoPrism 的通用视频编码器,利用单个冻结模型解决各种视频理解任务。通过在异构语料库上预训练 VideoPrism,其中包含 3600 万个高质量的视频字幕对和 5.82 亿个带有噪声的平行文本视频剪辑,通过全局
→
PDF
5 months ago
Prev
Next