关键词multimodal large language models
搜索结果 - 176
  • 医学中大型语言模型与多模态大型语言模型的综述
    PDF6 days ago
  • VS 助手:满足外科医生需求的多功能手术助手
    PDF6 days ago
  • FreeVA: 离线 MLLM 作为无需训练的视频助手
    PDF7 days ago
  • CuMo:多模态 LLM 与协同升级混合专家的扩展
    PDF11 days ago
  • 通过视觉令牌撤回,提升多模态大型语言模型的快速推理能力
    PDF11 days ago
  • 探究多模态 LLMs 作为驾驶世界模型
    PDF11 days ago
  • OmniDrive: 全面的 LLM-Agent 自动驾驶框架,具备三维感知、推理和规划功能
    PDF18 days ago
  • MileBench: 在长上下文中评测多语言大型语言模型
    PDF21 days ago
  • 多模态大型语言模型的幻觉:一项调查
    PDF21 days ago
  • SEED-Bench-2-Plus:基于多模态大型语言模型的文本丰富视觉理解基准测试
    PDF25 days ago
  • 真实化:释放大型多模态模型在真实材料上绘画 3D 对象的能力
    PDF25 days ago
  • 逐项列出:多模式 LLM 的新数据源和学习范式
    PDF25 days ago
  • TinyChart:使用视觉令牌合并和思维程序学习的高效图表理解
    PDF25 days ago
  • ImplicitAVE:一个开源数据集和隐式属性值提取的多模态 LLMs 基准
    PDFa month ago
  • Cantor: MLLM 的多模态思维链激发
    PDFa month ago
  • DesignProbe: 多模式大语言模型的平面设计基准
    PDFa month ago
  • 描述 - 理由:通过视觉理解训练改进多模态数学推理
    PDFa month ago
  • 增强对象智能:通过 XR-Objects 使模拟世界可交互
    PDFa month ago
  • MoVA: 将多模态背景下的视觉专家混合进行调整
    PDFa month ago
  • 眼见不一定全是实情:多模态大语言模型因果推理能力的基准测试
    PDFa month ago
Prev