BriefGPT.xyz
Ask
alpha
关键词
english webtext dataset
搜索结果 - 1
WanJuan-CC:安全且高质量的开源英语网络文本数据集
该研究介绍了万卷 - CC(WanJuan-CC),一个安全且高质量的开源英文网络文本数据集,用于语言模型的大规模预训练数据集构建。
PDF
4 months ago
Prev
Next