Nov, 2023

基于大语言模型的小样本分类与分割代理

TL;DR利用大型语言模型作为任务规划者,视觉模型作为工具,通过观察支持图像和使用语境学习指导大型语言模型,利用其总结和推理能力对查询图像进行分类和分割,从而在无需训练的情况下解决了少样本图像分类和分割问题,并在 Pascal-5i 数据集上取得了最先进的性能。