BriefGPT.xyz
大模型
Ask
alpha
关键词
flava
搜索结果 - 2
具有稳健遗忘机制的生命周期音视频屏蔽自编码器与局部对齐
我们提出了一种终身音视频遮罩自编码器,它能够在分布随时间不断变化的视频流中持续学习多模态表示。具体而言,我们提出了两个创新点来解决这个问题:(1)局部对齐:我们引入了一个小型可训练的多模态编码器,用于预测彼此相互对齐的音频和视频令牌。这使得
→
PDF
9 months ago
CVPR
FLAVA:一种基础语言和视觉对齐模型
本篇研究提出了一种名为 FLAVA 的综合视觉与语言基础模型,通过使用单一的综合的通用模型,同时针对视觉和语言任务以及跨模态任务,展现出出色的性能表现。
PDF
3 years ago
Prev
Next