关键词multimodal large language models
搜索结果 - 176
- 医学中大型语言模型与多模态大型语言模型的综述PDF6 days ago
- VS 助手:满足外科医生需求的多功能手术助手PDF6 days ago
- FreeVA: 离线 MLLM 作为无需训练的视频助手PDF7 days ago
- CuMo:多模态 LLM 与协同升级混合专家的扩展PDF11 days ago
- 通过视觉令牌撤回,提升多模态大型语言模型的快速推理能力PDF11 days ago
- 探究多模态 LLMs 作为驾驶世界模型PDF11 days ago
- OmniDrive: 全面的 LLM-Agent 自动驾驶框架,具备三维感知、推理和规划功能PDF18 days ago
- MileBench: 在长上下文中评测多语言大型语言模型PDF21 days ago
- 多模态大型语言模型的幻觉:一项调查PDF21 days ago
- SEED-Bench-2-Plus:基于多模态大型语言模型的文本丰富视觉理解基准测试PDF25 days ago
- 真实化:释放大型多模态模型在真实材料上绘画 3D 对象的能力PDF25 days ago
- 逐项列出:多模式 LLM 的新数据源和学习范式PDF25 days ago
- TinyChart:使用视觉令牌合并和思维程序学习的高效图表理解PDF25 days ago
- ImplicitAVE:一个开源数据集和隐式属性值提取的多模态 LLMs 基准PDFa month ago
- Cantor: MLLM 的多模态思维链激发PDFa month ago
- DesignProbe: 多模式大语言模型的平面设计基准PDFa month ago
- 描述 - 理由:通过视觉理解训练改进多模态数学推理PDFa month ago
- 增强对象智能:通过 XR-Objects 使模拟世界可交互PDFa month ago
- MoVA: 将多模态背景下的视觉专家混合进行调整PDFa month ago
- 眼见不一定全是实情:多模态大语言模型因果推理能力的基准测试PDFa month ago
Prev