BriefGPT.xyz
大模型
Ask
alpha
关键词
text2code benchmarks
搜索结果 - 1
Stack: 3 TB 开源许可的源代码
本文介绍了一个包含三十种编程语言的开源代码数据集 The Stack,以及如何构建、管理和使用该数据集来训练大型语言模型,通过在 Python 子集上训练 350M 参数解码器,在文本到代码的基准测试上取得了有前途的结果。
PDF
2 years ago
Prev
Next