Mar, 2024
利用LLMs自动化零射视觉识别的元提示
Meta-Prompting for Automating Zero-shot Visual Recognition with LLMs
TL;DR通过Meta-Prompting for Visual Recognition (MPVR)方法,仅凭目标任务的简短自然语言描述和相关类别标签的最小信息输入,自动产生一组多样的类别特定提示,从而实现强大的零样本分类器。在多个不同领域的流行的零样本图像识别基准上,使用多个LLMs和VLMs测试,MPVR可以有效地推广,比CLIP提高了最高19.8%和18.2%(平均20个数据集上分别为5.0%和4.5%),依赖于GPT和Mixtral LLMs。