ICLRApr, 2024
没有指数数据就没有 “零样本”:预训练概念频率决定多模态模型性能
No "Zero-Shot" Without Exponential Data: Pretraining Concept Frequency Determines Multimodal Model Performance
Vishaal Udandarao, Ameya Prabhu, Adhiraj Ghosh, Yash Sharma, Philip H.S. Torr...
TL;DR多模态模型的 “零样本” 泛化能力在大规模训练范式下面临指数级的数据需求,其性能受预训练数据集中概念频率的影响,并对长尾数据表现较差。