Apr, 2023

使用两万种类别进行开放式视觉识别的 Prompt 预训练

TL;DR该研究提出了一种名为 POMP 的提示预训练方法,可提取语义信息,且能够直接应用于不同的视觉识别任务,实现零样本学习,达到了 21 个下游数据集上的最佳性能。