BriefGPT.xyz
Ask
alpha
关键词
griffin architecture
搜索结果 - 1
递归 Gemma:超越变压器实现高效的开放式语言模型
我们介绍了一个开放的语言模型,使用了谷歌的全新的 Griffin 架构。Griffin 结合了线性递归和局部注意力,在语言方面有出色的表现。它具有固定大小的状态,可减少内存使用并在长序列上实现高效的推理。我们提供了一个已经预训练的模型,其中
→
PDF
3 months ago
Prev
Next