EMNLPSep, 2021

优化 Transformer 效率的技巧

TL;DR本文提出了多种简单的、不依赖硬件的方法,并将这些方法结合使用,以提高 Transformer 的效率,在 WMT 新闻翻译任务中,我们提高了强 Transformer 系统在 CPU 上的推理效率 3.80 倍,在 GPU 上的推理效率 2.52 倍。