关键词visual encoders
搜索结果 - 8
  • 视频预测模型作为通用视觉编码器
    PDFa month ago
  • ACL迷失在空间:探索视觉和语言重采样的细粒度空间理解
    PDF2 months ago
  • 面向手术姿势识别的零样本基于提示的视频编码器
    PDF3 months ago
  • MouSi:多视觉专家视觉语言模型
    PDF5 months ago
  • 现代电子游戏中数据高效的模仿学习的视觉编码器
    PDF7 months ago
  • 评估对于需要空间几何推理的物体组装任务的视觉表示的稳健性
    PDF9 months ago
  • 从 CLIP 到 DINO:多模式大型语言模型中的视觉编码器喊出来
    PDF9 months ago
  • VIGC: 视觉指令生成和校正
    PDF10 months ago
Prev
Next