关键词visual inputs
搜索结果 - 15
  • 意识到提示的适配器:为多模态大型语言模型学习自适应的视觉特征
    PDFa month ago
  • 基于 3T fMRI 数据和无监督学习的视网膜视觉图像重建
    PDF3 months ago
  • 加强多模式大型语言模型的启动式优化偏好
    PDF4 months ago
  • MLLM-Protector:确保 MLLM 安全性而不影响性能
    PDF6 months ago
  • 视觉编码解码模型用于人工智能辅导
    PDF8 months ago
  • 实时分析广播羽毛球视频
    PDF10 months ago
  • Google 巴德的视觉理解有多好?对开放挑战的实证研究
    PDFa year ago
  • LLaMA-Adapter V2: 参数高效的视觉指令模型
    PDFa year ago
  • 神经约束满足:层次抽象在物体重新排列中的组合推广
    PDFa year ago
  • 自我提升机器人:端到端自主视觉动作强化学习
    PDFa year ago
  • 利用有损特征进行泛化:利用广泛的离线数据学习视觉运动任务
    PDF2 years ago
  • 从像素中学习跳跃
    PDF3 years ago
  • SAM: 条件视觉行驶策略学习的压缩和模仿网络
    PDF5 years ago
  • 回归规划网络
    PDF5 years ago
  • AAAI用像素进行(几乎)实时规划
    PDF6 years ago
Prev
Next