关键词multi-modal language models
搜索结果 - 9
- 图像能否代表千言万语?深入探究视觉语言模型的空间推理PDF13 days ago
- 我们真的需要一个复杂的代理系统吗?将具体化的代理蒸馏成单一模型PDF3 months ago
- 自动驾驶问答的多帧、轻量级和高效视觉语言模型PDF3 months ago
- VisLingInstruct: 用自主指令优化提升多模式语言模型中的零样本学习PDF5 months ago
- MMICT:使用上下文示例提升多模态微调PDF7 months ago
- Causal-CoG: 基于因果效应的上下文生成对多模态语言模型的提升PDF7 months ago
- ArchBERT: 神经架构和自然语言的双模理解PDF8 months ago
- DeepSpeed-VisualChat:多轮多图像交互聊天通过多模态因果关注PDF9 months ago
- 从复杂文档中提取结构化信息的基准测试PDF2 years ago
Prev
Next