May, 2022

TRT-ViT:针对 TensorRT 的 Vision Transformer

TL;DR本文主要从实际应用的角度重新审视 Transformer,并将硬件延迟作为衡量计算效率的指标,提出一系列针对 TensorRT 的网络设计实践指南,并给出了一家 TRT-ViT 的网络模型,实验表明在不同的视觉任务中,TRT-ViT 在延迟 / 准确性的权衡方面显著优于现有的 ConvNets 和 Vision Transformers。