BriefGPT.xyz
大模型
Ask
alpha
关键词
vllms
搜索结果 - 2
VL-ICL Bench: 基于多模态上下文学习的基准测试中的细节之魔鬼
该研究介绍了一个全面的多模态上下文学习基准测试 VL-ICL Bench,评估了先进的视觉大语言模型在这个基准测试套件上的能力,揭示了它们的各种优势和弱点,并表明即使是最先进的模型,如 GPT-4,也会在这些任务中面临挑战。
PDF
3 months ago
PerceptionGPT: 将视觉感知有效融合到 LLM 中
本文提出了一种名为 PerceptionGPT 的新型端到端框架,通过利用 LLMs 的 token 嵌入的表示能力,高效有效地赋予 VLLMs 视觉感知能力。该方法以 LLMs 的 token 嵌入作为空间信息的携带者,利用轻量级的视觉任
→
PDF
8 months ago
Prev
Next