Sep, 2022

VL-Taboo:面向属性的零样本视觉-语言模型能力分析

TL;DR本研究分析了基于大规模数据的视觉-语言模型的真正零样本能力及其属性基零样本学习能力,评估了现有模型对不同基准测试的性能表现及影响因素。结果表明该模型主要通过识别语言中的类标签实现零样本学习,属性数的变化会显著影响其表现。