BriefGPT.xyz
Ask
alpha
关键词
attention-based language models
搜索结果 - 1
简单线性注意力语言模型平衡召回 - 吞吐量的权衡
通过应用实验和理论到广泛的架构上,我们发现语言模型的状态大小与召回能力之间存在关键权衡。我们提出了一种名为 BASED 的简单架构,结合了线性和滑动窗口的注意力机制,通过改变窗口大小和线性注意力特征维度,我们可以在召回 - 内存权衡曲线的帕
→
PDF
4 months ago
Prev
Next