Nov, 2022

EVA: 探索规模下遮蔽式视觉表征学习的极限

TL;DR我们在这篇论文中提出了 EVA,这是一种基于视觉的基础模型,能够大规模地探索视觉表征的极限,并且只使用公开可用的数据。通过解决预先设定的任务,我们可以有效地将 EVA 扩展到 10 亿个参数,并在诸如图像识别、视频动作识别、目标检测、实例分割和语义分割等广泛的代表性视觉下游任务上创造新的记录,而无需进行大量的监督式训练。