pre-trained vision language models | BriefGPT

关键词pre-trained vision language models

搜索结果 - 4

超越类别：通过语言解释实现零样本情境识别
通过引入 Language EXplainer (LEX) 方法，本文在 SWiG 数据集上验证了预训练的视觉语言模型在零样本场景理解和基于场景的情境识别方面的有效性和互操作性。
PDF2 months ago
利用 GPT-4 从建筑 fasade 图像进行零样本建筑年龄分类
使用预训练视觉语言模型 GPT-4 Vision，开发了一个零训练的建筑物立面图像年龄分类器，能够从单一立面图像中粗略预测建筑物的年代。
PDF3 months ago
视觉语言模型中的主动提示学习
基于现有观察，我们提出了一个名为 PCB 的新型主动学习框架，对预训练视觉语言模型（VLMs）进行自适应，以解决标签获取成本高的问题，并在七个真实数据集上实验证明，在性能上超越了传统的主动学习和随机取样方法。
PDF8 months ago
ICLR使用预训练视觉语言模型的医学图像理解：一项全面研究
本文通过研究预训练视觉语言模型在医学图像领域的知识传递能力，发现合理设计的医学提示语是调用预训练模型知识的关键。通过使用在领域间共享的表达属性提示，可实现知识跨越领域，改进泛化能力，对新对象的识别有所优化。此外，通过自动化生成医学提示的三种
PDF2 years ago