关键词large multimodal models
搜索结果 - 72
  • 大陆十字路口:基于大型多模态模型的文化适应自动工艺品提取
    PDF4 days ago
  • MMEvalPro:多模态基准测试的可靠和高效评估
    PDF7 days ago
  • MM-Instruct: 大型多模态模型对齐的生成视觉指令
    PDF8 days ago
  • ARES:交替强化学习和监督微调,通过多样化的 AI 反馈提升多模态链式思维推理
    PDF11 days ago
  • 针对大型多模型中的语音特定风险进行探究:一种分类、基准和洞见
    PDF11 days ago
  • 大型多模态模型时代中的指代表达理解评估再探
    PDF12 days ago
  • PIN:一种适用于配对和交错多模态文档的知识密集数据集
    PDF16 days ago
  • 可学习的上下文向量用于视觉问答
    PDF17 days ago
  • 奥林匹克竞技场:对超智能人工智能的多学科认知推理进行基准测试
    PDF18 days ago
  • 通过迭代实验编程实现大型多模态模型自动基准测试
    PDF18 days ago
  • 利用 LMM 激发的情感嵌入进行干扰图像检测
    PDF18 days ago
  • LLARVA: 视觉动作指令调整增强机器人学习
    PDF19 days ago
  • MINT-1T:将开源多模态数据放大 10 倍:一万亿令牌的多模态数据集
    PDF19 days ago
  • 比较视觉指导优化
    PDF23 days ago
  • Yo'LLaVA: 个性化语言和视觉助手
    PDF23 days ago
  • CMC-Bench:走向视觉信号压缩的新范式
    PDF23 days ago
  • VideoGPT+: 图像和视频编码器的综合应用以提升视频理解能力
    PDF23 days ago
  • MobileAIBench: 用于设备上应用场景的 LLM 和 LMM 基准测试
    PDF24 days ago
  • 基于概念的大规模多模态模型可解释性框架
    PDF24 days ago
  • F-LMM: 冻结大规模多模态模型的基础
    PDFa month ago
Prev