ACLMay, 2020

硬件感知的 Transformer 模型用于高效自然语言处理

TL;DR通过神经架构搜索,设计了硬件感知的 Transformer 来保证在资源受限的硬件平台上具有低延迟推断的能力,从而在机器翻译任务中显著提高速度和模型效率。