May, 2023

OneCAD:多模态学习用于所有图像数据集的一个分类器

TL;DR本文提出了一种名为 OneCAD 的框架,通过 Multimodal learning 和 Mask-Image-Modeling 技术,用于训练和推理 Transformer 模型,使得模型架构不再与数据集中的类别数相关,并在 MNIST、CIFAR10、CIFAR100 和 COVIDx 等数据集上给出了初步结果。