BriefGPT.xyz
Ask
alpha
关键词
base large language model
搜索结果 - 1
Jamba:混合 Transformer-Mamba 语言模型
基于混合 Transformer-Mamba 和专家混合 (MoE) 架构,Jamba 是一个强大的基础大型语言模型,具有资源和目标特定的配置,能够在单个 80GB GPU 上提供高吞吐量和小内存占用,同时在标准语言模型基准测试和长文本上展
→
PDF
3 months ago
Prev
Next