Oct, 2024

具备10亿参数的低资源语言生成模型

TL;DR本研究针对现有的大型语言模型在低资源语言上的局限性,提出了一种新方法开发适用于斯洛文尼亚语的生成模型GaMS 1B。通过对英语OPT模型的持续预训练和新的分词器的开发,研究表明GaMS在句子简化任务上表现出色,与GPT-3.5-Turbo模型相媲美,显示了其潜在的应用价值。