May, 2024

基于小波的图像分词方法用于视觉变压器

TL;DR基于小波变换的图像分词器提高了训练吞吐量并减少了 ImageNet 验证集的 top-1 误差率,同时为基于 ViT 模型设计提供了新的研究方向。