BriefGPT.xyz
大模型
Ask
alpha
关键词
visual tokenizers
搜索结果 - 1
大型语言模型的良好视觉分词器的特点是什么?
通过实证研究,我们讨论了将主流的预训练方法应用于视觉编码器以构建良好的视觉分词器,以使大型语言模型(LLM)成为强大的多模态大语言模型(MLLM)。我们发现,GVT 在不引入额外的参数和任务特定的微调的情况下,展现出了在多个尺度上的强大视觉
→
PDF
a year ago
Prev
Next