关键词visual encoders
搜索结果 - 8
- 视频预测模型作为通用视觉编码器PDFa month ago
- ACL迷失在空间:探索视觉和语言重采样的细粒度空间理解PDF2 months ago
- 面向手术姿势识别的零样本基于提示的视频编码器PDF3 months ago
- MouSi:多视觉专家视觉语言模型PDF5 months ago
- 现代电子游戏中数据高效的模仿学习的视觉编码器PDF7 months ago
- 评估对于需要空间几何推理的物体组装任务的视觉表示的稳健性PDF9 months ago
- 从 CLIP 到 DINO:多模式大型语言模型中的视觉编码器喊出来PDF9 months ago
- VIGC: 视觉指令生成和校正PDF10 months ago
Prev
Next