Oct, 2020
TurboTransformers: Transformer 模型的高效 GPU 服务系统
TurboTransformers: An Efficient GPU Serving System For Transformer Models
Jiarui Fang, Yang Yu, Chengduo Zhao, Jie Zhou
TL;DR本文设计了名为 TurboTransformers 的 transformer 服务系统,包括计算运行时和服务框架,能够以很少的代码集成到 PyTorch 中,在 GPU 平台上实现最先进的 transformer 模型服务性能。