BriefGPT.xyz
大模型
Ask
alpha
关键词
nordic languages
搜索结果 - 3
GPT-SW3:针对北欧语言的自回归语言模型
本篇论文介绍了第一个本地大型生成语言模型 GPT-SW3 的开发过程,包括数据收集和处理、训练配置和指令微调、评估以及发布策略的考虑,并希望该论文能为其他研究者在小语种的大型生成模型的开发提供指南和参考。
PDF
a year ago
北欧桩:一个用于语言建模的 1.2TB 北欧数据集
为了推动在诸如北欧语言这样的小语种中开发 LLMs,我们策划了一个高质量的数据集,其中包含所有主要的北日耳曼语言(丹麦语、冰岛语、挪威语和瑞典语),以及一些高质量的英语数据,并详细介绍了我们的数据收集、清理和过滤的过程。
PDF
a year ago
Multilingual BERT 在语言生成方面是否流利?
本文探讨了多语言 BERT 模型在语言编码、语法特性、语言生成等任务上的表现,发现该模型性能低于单语言模型,在某些情况下无法取代单语言模型,尤其在北欧语言方面表现不足。
PDF
5 years ago
Prev
Next