关键词multi-modal language models
搜索结果 - 9
  • 图像能否代表千言万语?深入探究视觉语言模型的空间推理
    PDF13 days ago
  • 我们真的需要一个复杂的代理系统吗?将具体化的代理蒸馏成单一模型
    PDF3 months ago
  • 自动驾驶问答的多帧、轻量级和高效视觉语言模型
    PDF3 months ago
  • VisLingInstruct: 用自主指令优化提升多模式语言模型中的零样本学习
    PDF5 months ago
  • MMICT:使用上下文示例提升多模态微调
    PDF7 months ago
  • Causal-CoG: 基于因果效应的上下文生成对多模态语言模型的提升
    PDF7 months ago
  • ArchBERT: 神经架构和自然语言的双模理解
    PDF8 months ago
  • DeepSpeed-VisualChat:多轮多图像交互聊天通过多模态因果关注
    PDF9 months ago
  • 从复杂文档中提取结构化信息的基准测试
    PDF2 years ago
Prev
Next