May, 2022

TRT-ViT:针对TensorRT的Vision Transformer

TL;DR本文主要从实际应用的角度重新审视Transformer,并将硬件延迟作为衡量计算效率的指标,提出一系列针对TensorRT的网络设计实践指南,并给出了一家TRT-ViT的网络模型,实验表明在不同的视觉任务中,TRT-ViT在延迟/准确性的权衡方面显著优于现有的ConvNets和Vision Transformers。