May, 2023

使用半监督学习和视觉 Transformer 的细粒度分类迁移学习

TL;DR本研究探讨了 Semi-ViT,一种使用半监督学习技术微调 ViT 模型的图像分类方法,该方法更适用于缺乏注释数据的情况,特别是在电子商务等领域。我们的研究发现,即使在有限的注释数据的情况下,Semi-ViT 的性能也优于传统卷积神经网络(CNN)和 ViT。这些发现表明,Semi-ViT 在需要精细分类视觉数据的应用领域具有重要的应用前景。