BriefGPT.xyz
Ask
alpha
关键词
re-use of hidden states
搜索结果 - 1
IJCAI
共享注意力权重用于快速 Transformer
本文提出一种基于共享注意力权重和隐藏状态重用的快速、轻量级的注意力模型,用于加速 Transformer 机器翻译系统,在十项 WMT 和 NIST OpenMT 任务上实现了平均 1.3 倍的速度提升(几乎不降低 BLEU)和与 Aan
→
PDF
5 years ago
Prev
Next