BriefGPT.xyz
Ask
alpha
关键词
deepseek llm 67b
搜索结果 - 1
DeepSeek LLM: 以长期主义为基础扩展开源语言模型
通过研究扩展定律,我们发现了 DeepSeek LLM 在两种常用的开源配置下,7B 和 67B,用于扩展大规模模型的独特发现,并介绍了 DeepSeek LLM 项目的长期前景。通过创建包含 2 万亿标记的数据集并不断扩展,来支持预训练阶
→
PDF
6 months ago
Prev
Next