May, 2024

LOTUS: 通过稀疏修剪和数据抽奖提高 Transformer 效率

TL;DRLOTUS 是一种利用数据抽奖选择和稀疏剪枝来加速视觉变换器训练的新方法,通过识别和利用最信息丰富的数据子集并消除冗余模型参数来优化训练过程,通过广泛的实验证明了 LOTUS 在快速收敛和高准确度达到显著降低计算要求方面的有效性,这项工作突出了在高效视觉变换器训练方面结合数据选择和稀疏技术的潜力,为进一步的研究和开发提供了机会。