BriefGPT.xyz
大模型
Ask
alpha
关键词
mdvp-bench
搜索结果 - 1
绘制与理解:利用视觉提示使 MLLMs 能够理解您想要的内容
我们介绍了 Draw-and-Understand 项目,其中包括一种新的多模域数据集和一种具有挑战性的视觉提示基准测试。我们提出了 SPHINX-V,一种新的端到端训练的多模域大型语言模型,用于连接视觉编码器、视觉提示编码器和语言理解模型
→
PDF
3 months ago
Prev
Next