BriefGPT.xyz
大模型
Ask
alpha
关键词
vision language tasks
搜索结果 - 2
CoLLaVO: 蜡笔大规模语言与视觉模型
当前的视觉语言模型 (VLMs) 的图像理解能力与其在零样本视觉语言任务上的表现强相关。我们提出了一个新的视觉提示调整方案,即使用蜡笔提示进行指导调整,以提高对象级图像理解能力。此外,我们还提出了双重 QLoRA 学习策略,以在视觉指导调整
→
PDF
5 months ago
视觉语言变换器:一项调研
视觉语言任务中,基于预训练的变压器架构在视觉语言建模方面表现出色,为视觉和语言结合的任务带来了类似的进展。
PDF
a year ago
Prev
Next