BriefGPT.xyz
Ask
alpha
关键词
lora-the-explorer
搜索结果 - 1
使用并行低秩适配器从头训练神经网络
深度学习模型的可扩展性受到计算资源、内存和通讯的根本限制。本文在模型预训练中探索了低秩适应(LoRA)方法的应用,介绍了 LoRA-the-Explorer(LTE)算法,通过在计算节点上进行多个低秩头的并行训练来减少同步频率,使用不同视觉
→
PDF
4 months ago
Prev
Next