Jul, 2024

以ImageNet水平成本访问视觉基础模型

TL;DR使用名称为 Proteus 的简单通用解决方案,在无法访问原始训练数据的情况下,通过移除传统知识蒸馏设置中导致数据集偏差的设计,并提供三个级别的训练目标,即令牌、补丁和特征,最大化知识传递的有效性,在 ImageNet 层次的开销下进行训练,从而使广大研究社区能够更轻松地获得训练基础模型的能力。