关键词large multimodal models
搜索结果 - 69
  • MM-Instruct: 大型多模态模型对齐的生成视觉指令
    PDF4 days ago
  • 针对大型多模型中的语音特定风险进行探究:一种分类、基准和洞见
    PDF7 days ago
  • 大型多模态模型时代中的指代表达理解评估再探
    PDF8 days ago
  • PIN:一种适用于配对和交错多模态文档的知识密集数据集
    PDF12 days ago
  • 可学习的上下文向量用于视觉问答
    PDF13 days ago
  • 奥林匹克竞技场:对超智能人工智能的多学科认知推理进行基准测试
    PDF14 days ago
  • 通过迭代实验编程实现大型多模态模型自动基准测试
    PDF14 days ago
  • 利用 LMM 激发的情感嵌入进行干扰图像检测
    PDF14 days ago
  • LLARVA: 视觉动作指令调整增强机器人学习
    PDF15 days ago
  • MINT-1T:将开源多模态数据放大 10 倍:一万亿令牌的多模态数据集
    PDF15 days ago
  • 比较视觉指导优化
    PDF19 days ago
  • Yo'LLaVA: 个性化语言和视觉助手
    PDF19 days ago
  • CMC-Bench:走向视觉信号压缩的新范式
    PDF19 days ago
  • VideoGPT+: 图像和视频编码器的综合应用以提升视频理解能力
    PDF19 days ago
  • MobileAIBench: 用于设备上应用场景的 LLM 和 LMM 基准测试
    PDF20 days ago
  • 基于概念的大规模多模态模型可解释性框架
    PDF20 days ago
  • F-LMM: 冻结大规模多模态模型的基础
    PDF23 days ago
  • 基于大型多模态模型的石材劣化模式识别
    PDFa month ago
  • AAAI基于 LMM 的知识在图像分类任务中的利用
    PDFa month ago
  • 大型多模态模型在医学视觉问答中的令人尴尬的简单探测评估:比随机还差?
    PDFa month ago
Prev