BriefGPT.xyz
Ask
alpha
关键词
allo
搜索结果 - 2
大型语言模型对齐的低冗余优化
在这篇研究论文中,研究人员通过对大型语言模型(LLMs)的经验研究发现了对齐训练中存在的冗余神经元,并提出了一种名为 ALLO 的低冗余对齐方法。该方法通过梯度策略识别与人类偏好数据相关的神经元,通过奖励模型计算损失来识别与对齐相关的关键词
→
PDF
18 days ago
Allo: 可组合加速器设计的编程模型
通过使用 Allo 编程模型,我们提出了一种有效的空间加速器设计方法,能够在各种应用和深度学习模型中取得更好的性能和能源效率,相比于 NVIDIA A100 GPU,Allo 生成的加速器在 GPT2 模型上具有 1.7 倍的推理延迟和 5
→
PDF
3 months ago
Prev
Next