BriefGPT.xyz
Nov, 2024
视觉语言预训练的正确分类方法
Classification Done Right for Vision-Language Pre-Training
HTML
PDF
Huang Zilong, Ye Qinghao, Kang Bingyi, Feng Jiashi, Fan Haoqi
TL;DR
本研究解决了视觉语言预训练中分类方法的有效性问题,提出了一种名为SuperClass的简化分类方法,直接利用标记的原始文本作为监督分类标签,省去了文本编码的需要。研究表明,SuperClass在多种下游任务中表现突出,潜在影响在于为视觉语言任务提供了一种更高效的分类方法。
Abstract
We introduce
SuperClass
, a super simple
Classification
method for
Vision-Language
→