EMNLPFeb, 2022

EdgeFormer: 一种高效参数的边缘 Transformer 用于设备上 Seq2seq 生成

TL;DREdgeFormer 是一种面向严格计算和内存限制下的设备本地序列生成的小型 Transformer,应用了两个新颖的成本效益参数化原则,扩展了共享层的网络,并通过大量实验达到了竞争优势。提出了 EdgeLM,这是第一个可供公开使用的在设备上预训练的序列到序列模型,可在实践中促进设备本地序列生成并取得良好结果。