BriefGPT.xyz
大模型
Ask
alpha
关键词
i-vl pre-training
搜索结果 - 1
ECCV
促使视觉 - 语言模型实现高效视频理解
本研究提出了一种简单但强大的基准线以有效地适应预训练的 I-VL 模型,并利用其强大的资源 - hungry 视频理解任务的能力进行最小化的训练,通过几个随机向量连续提示向量进行优化,将视频相关任务转化为与预训练目标相同的格式。对于行动识别
→
PDF
3 years ago
Prev
Next