BriefGPT.xyz
大模型
Ask
alpha
关键词
auto-regressive fashion
搜索结果 - 1
CVPR
冻结大型语言模型在视觉信号理解中的应用
我们研究了大型语言模型(LLM)在没有对多模态数据集进行微调的情况下,直接理解视觉信号的潜力。我们提出了一种视觉到语言的分词器(V2T Tokenizer),通过编码器 - 解码器、LLM 词汇表和 CLIP 模型将图像转换成 “外语”。通
→
PDF
4 months ago
Prev
Next