关键词vlms
搜索结果 - 35
- ICAL: 将轨迹转化为可行动洞见的多模态智能体的持续学习PDF14 days ago
- 通过对目标令牌进行上下文注入,增强视觉语言模型中的跨提示可转移性PDF15 days ago
- RoboPoint:机器人的空间可行性预测的视觉语言模型PDF19 days ago
- CVPR探索视觉语言组合性和识别的光谱PDF21 days ago
- MiniGPT - 反设计:利用 MiniGPT-4 预测图像调整PDFa month ago
- 视觉对齐中的图像识别:优先考虑视觉相似性PDFa month ago
- 隐私感知的视觉语言模型PDFa month ago
- DreamScene4D: 从单目视频生成动态多物体场景PDF2 months ago
- 构建视觉 - 语言模型时的要点PDF2 months ago
- 超越人类视角:大型视觉语言模型在显微镜图像分析中的作用PDF2 months ago
- 通过多知识表示优化视觉语言模型的提示学习PDF3 months ago
- RESSA:通过稀疏跨模态适应修复稀疏视觉语言模型PDF3 months ago
- CVPRViTamin:设计可扩展的视觉模型在视觉语言时代PDF3 months ago
- Mini-Gemini: 挖掘多模视觉语言模型的潜力PDF3 months ago
- CFPL-FAS: 无类别提示学习的通用人脸反欺骗PDF3 months ago
- 面向视觉与语言模型的多模态上下文学习PDF3 months ago
- ACL基于图表的推理:从 LLMs 向 VLMs 的能力转移PDF3 months ago
- ICLR图像胜于千言:视觉语言模型间的提示对抗传递PDF4 months ago
- 利用 WebSight 数据集解锁网页截图转换为 HTML 代码PDF4 months ago
- ICLR智能视觉演绎推理有多远?PDF4 months ago
Prev