Nov, 2024

视觉语言预训练的正确分类方法

TL;DR本研究解决了视觉语言预训练中分类方法的有效性问题,提出了一种名为SuperClass的简化分类方法,直接利用标记的原始文本作为监督分类标签,省去了文本编码的需要。研究表明,SuperClass在多种下游任务中表现突出,潜在影响在于为视觉语言任务提供了一种更高效的分类方法。