BriefGPT.xyz
Ask
alpha
关键词
japanese large language models
搜索结果 - 1
构建大规模的日语网络语料库用于大型语言模型
通过从 Common Crawl 档案中提取和精炼文本,该研究构建了一个大型的日语网页语料库,用于训练日语大型语言模型。该语料库包含大约 3121 亿个字符(约 1.73 亿页),是目前可用的日语训练语料库中最大的,超过了 CC-100、m
→
PDF
2 months ago
Prev
Next