BriefGPT.xyz
大模型
Ask
alpha
关键词
efficient video learning
搜索结果 - 1
ECCV
冻结的 CLIP 模型是高效的视频学习者
本文提出 Efficient Video Learning (EVL) 框架,使用轻量级 Transformer 解码器和学习查询标记以从 CLIP 图像编码器中动态收集帧级空间特征,进一步采用每个解码器层中的局部时间模块来发现相邻帧及其注
→
PDF
2 years ago
Prev
Next