BriefGPT.xyz
大模型
Ask
alpha
关键词
slms
搜索结果 - 2
HARE:人类先验:小语言模型效率的关键
在资源受限环境中进行高效语言模型训练的研究,提出了一种利用人类先验知识进行数据构建的原则,并通过在简洁数据集上训练 HARE-1.1B 模型来验证该原则的有效性。
PDF
17 days ago
小型语言模型中实现稀疏激活
我们在小型语言模型(SLMs)中实现了稀疏激活,并通过新的归因测量指标以达到精确的稀疏激活,实验证明我们的方法可以在只损失 < 5% 的模型准确性的情况下实现 80% 的稀疏化比率,可与大型语言模型(LLMs)中实现的稀疏激活相媲美。
PDF
a month ago
Prev
Next