Apr, 2021

具有补丁多样化的视觉 Transformer

TL;DR本文提出一种新的损失函数来促进视觉转换器中提取的补丁表示的差异性,以稳定训练并改善下游的语义分割任务的结果。实验证明,这种方法可以训练更广泛和更深的视觉转换器,并在 Cityscapes 和 ADE20k 上增强了最新的结果。