Dec, 2022

使用视觉Transformer学习不平衡数据

TL;DR该论文介绍了一种名为 LiVT 的模型,使用 Long-Tailed 数据进行训练,其中使用了 Masked Generative Pretraining (MGP) 和Balanced Binary Cross Entropy(Bal-BCE)来优化模型性能,结果表明该模型在 iNaturalist 2018 上的 Top-1 准确率可达81.0%。