BriefGPT.xyz
Ask
alpha
关键词
redundant neurons
搜索结果 - 2
大型语言模型对齐的低冗余优化
在这篇研究论文中,研究人员通过对大型语言模型(LLMs)的经验研究发现了对齐训练中存在的冗余神经元,并提出了一种名为 ALLO 的低冗余对齐方法。该方法通过梯度策略识别与人类偏好数据相关的神经元,通过奖励模型计算损失来识别与对齐相关的关键词
→
PDF
18 days ago
深度神经网络的数据无关参数剪枝
本研究探讨在已训练的神经网络模型中修剪神经元的问题并提出了一种系统性的方式去除冗余的相似神经元,并且通过在 MNIST 训练网络中修剪密集连接层,达到 85% 的总参数去除率,在 AlexNet 上达到 35%去除率,并且没有明显影响其性能
→
PDF
9 years ago
Prev
Next