BriefGPT.xyz
大模型
Ask
alpha
关键词
pretrained llms
搜索结果 - 4
OpenBezoar: 小型、经济高效且开放式模型用于混合指导数据训练
使用基于 OpenLLaMA 3Bv2 的基本模型,我们描述了用于微调 OpenBezoar 系列模型的配方,并证明了最终检查点 “OpenBezoar-HH-RLHF-DPO” 在 3B 参数规模上胜过许多其他模型。
PDF
3 months ago
由标签分布指导的上下文示例排序
通过优化问题,研究通过预训练语言模型的上下文学习中的示例排序,以提高文本分类的准确性和选择更好的上下文示例。
PDF
5 months ago
稀疏化再分类:从大型语言模型的内部神经元到高效的文本分类器
我们的研究提出了一种使用所有内部表示的方法,通过在所有激活和隐藏状态上采用多种池化策略,首先逐层稀疏化特定于任务的特征,然后在层之间进行聚合,用于文本分类。我们的实验证明,STC 不仅在预训练和微调模型上稳定提高了分类性能,而且在训练和推断
→
PDF
7 months ago
超越大小:梯度如何塑造大型语言模型的剪枝决策
预训练的大型语言模型的梯度为基础的模型修剪器(GBLM-Pruner)通过利用卡尔曼几何中的几何相互关联性明显胜过其他竞争对手,并在各种语言评估中超过了幅度修剪、Wanda 和 SparseGPT。
PDF
8 months ago
Prev
Next