BriefGPT.xyz
Ask
alpha
关键词
performance potential
搜索结果 - 2
用于参数高效微调的 Mini-Ensemble 低秩适配器
MELoRA 是一种采用较少可训练参数但保持较高秩的迷你低秩适配器,用于针对预训练大型语言模型进行性能优化的方法。实验证明,在自然语言理解和指令跟随任务上,相较于低秩适配器 LoRA,MELoRA 在拥有 8 倍较少可训练参数时表现更好,而
→
PDF
5 months ago
稀疏神经网络的硬件限制:稀疏屋顶线
我们引入了稀疏屋顶线,一种用于评估神经网络中稀疏性能的视觉性能模型。该模型同时考虑了网络准确性、稀疏性和预测的推理加速度。通过使用一种新颖的分析模型预测稀疏网络性能,并通过在多个真实世界计算机视觉架构上对稀疏模式和程度进行验证,我们验证了预
→
PDF
10 months ago
Prev
Next