Jul, 2023

Patch n' Pack: NaViT,一种可适用于任何长宽比和分辨率的视觉Transformer

TL;DRNaViT使用序列打包技术处理任意分辨率和长宽比的输入图像,可以应用于图像分类、目标检测和语义分割等任务,并且在鲁棒性和公平性基准测试中显示出良好的性能。