Sep, 2023

引入 DictaLM -- 一个用于现代希伯来语的大型生成语言模型

TL;DR我们介绍了 DictaLM,这是一个专为现代希伯来语而设计的大规模语言模型。拥有 70 亿参数,该模型主要基于希伯来语中心化的数据进行训练。为了促进希伯来语的研究和发展,我们以创作共用许可证的形式发布了基础模型和指导调整模型。同时,我们还推出了 DictaLM-Rab,这是另一个面向拉比 / 历史希伯来语的基础模型。这些基础模型是针对各种希伯来语特定任务(如指导、问答、情感分析等)进行微调的理想起始点。此发布代表了一个初步的步骤,为希伯来语 NLP 社区提供了一个初始的希伯来语 LLM 模型供实验使用。