关键词multimodal tasks
搜索结果 - 43
  • INS-MMBench: 保险领域 LVLMs 性能综合评估的全面基准
    PDF19 days ago
  • 面向视觉 - 语言地理基础模型:一项调查
    PDF19 days ago
  • 诺米嵌入视觉:扩展潜在空间
    PDFa month ago
  • 隐式多模态对齐:关于将冻结的 LLM 泛化到多模态输入
    PDFa month ago
  • 利用 GPT-4V (ision) 进行保险业的初步探索
    PDF3 months ago
  • HAMMR: 分层多模态反应智能代理程序用于通用 VQA
    PDF3 months ago
  • MoPE: 通过混合提示专家实现参数高效且可扩展的多模态融合
    PDF4 months ago
  • 基于上下文的多模态融合
    PDF4 months ago
  • INSTRAUG: 多模态指令微调的自动指令增强
    PDF4 months ago
  • 多模态大型语言模型的统一幻觉检测
    PDF5 months ago
  • 生成多模态模型是上下文学习者
    PDF6 months ago
  • 本地化符号化知识蒸馏用于视觉常识模型
    PDF7 months ago
  • 大型语言模型的复合后门攻击
    PDF9 months ago
  • AnyMAL: 一种高效且可扩展的任意模态增强语言模型
    PDF9 months ago
  • 图像、视频、音频和语言任务的统一模型
    PDFa year ago
  • SPAE:使用固定的 LLMs 进行多模态生成的语义金字塔自编码器
    PDFa year ago
  • 多模式大型语言模型综述
    PDFa year ago
  • 差异掩蔽:选择连续预训练中需掩蔽的内容
    PDFa year ago
  • i-Code Studio:一个可配置的、可组合的综合人工智能框架
    PDFa year ago
  • LLM 可以自行阅读和生成 CXR 图像
    PDFa year ago
Prev