BriefGPT.xyz
大模型
Ask
alpha
关键词
additive attention
搜索结果 - 1
Fastformer:加性注意力足矣
本文介绍了 Fastformer 模型,这是一种基于加法注意力的高效 Transformer 模型,与现有的 Transformer 模型相比,它可以更有效地建模长文本,并且具有线性复杂度。
PDF
3 years ago
Prev
Next