May, 2024

自监督视觉 Transformer 的损失可视化

TL;DR利用损失景观的方法调查了 Masked autoencoder 在自监督的 ViT 训练中对更好的泛化能力和梯度修正的作用。