关键词vision language model
搜索结果 - 10
- CarLLaVA: 基于视觉和语言模型的无需传感器驱动闭环驾驶PDF16 days ago
- 大型视觉语言模型的语境情感识别PDF2 months ago
- 利用大型语言模型和视觉语言模型增强交互式图像检索的查询重写PDF2 months ago
- 使用 VLM 进行零 - shot 视频问答:图像栅格能表达视频的价值PDF3 months ago
- ScreenAgent:基于视觉语言模型的计算机控制代理PDF5 months ago
- CLIP-Loc:面向基于物体的地图的多模式地标关联全局定位PDF5 months ago
- DME-Driver: 自主驾驶中融合人类决策逻辑与 3D 场景感知PDF6 months ago
- GPT-4V (ision) 用于机器人:来自人类演示的多模态任务规划PDF7 months ago
- 通过自然语言反馈指导大型视觉语言模型与人类进行对齐和交互PDF7 months ago
- PaLI-3 视觉语言模型:更小、更快、更强PDF9 months ago
Prev
Next