BriefGPT.xyz
大模型
Ask
alpha
关键词
fineweb
搜索结果 - 1
FineWeb 数据集:对网络进行精细分离以获取大规模最佳文本数据
FineWeb 是一个从 96 个 Common Crawl 快照中派生出的 1500 万亿标记数据集,比其他公开预训练数据集产生更好性能的大型语言模型(LLM)。LLMs 在 FineWeb 上预训练表现出更好的知识和推理能力,我们公开释
→
PDF
9 days ago
Prev
Next