BriefGPT.xyz
Ask
alpha
关键词
vidl model design
搜索结果 - 1
CVPR
VindLU:一种实现视频与语言预训练的有效方法
该研究论文分析了现代视频和语言(VidL)模型设计的最重要因素,其中包括时空建模、多模态融合、预训练数据选择和细调等,发现视频到文本多模态融合、掩蔽建模目标和图像和视频的联合训练等设计因素对于提高模型效果非常重要,提出了一种名为 VindL
→
PDF
2 years ago
Prev
Next