BriefGPT.xyz
大模型
Ask
alpha
关键词
peak gpu memory
搜索结果 - 1
LaMDA:通过频谱分解的低维度调整进行大模型微调
通过光谱分解低维适应性的大型模型微调,LaMDA 可以在减少可训练参数和峰值 GPU 内存使用的同时,达到与现有替代方案相当甚至更好的性能。
PDF
16 days ago
Prev
Next