Oct, 2020

TurboTransformers: Transformer 模型的高效 GPU 服务系统

TL;DR本文设计了名为 TurboTransformers 的 transformer 服务系统,包括计算运行时和服务框架,能够以很少的代码集成到 PyTorch 中,在 GPU 平台上实现最先进的 transformer 模型服务性能。