Jun, 2024

LaMDA:通过频谱分解的低维度调整进行大模型微调

TL;DR通过光谱分解低维适应性的大型模型微调,LaMDA 可以在减少可训练参数和峰值 GPU 内存使用的同时,达到与现有替代方案相当甚至更好的性能。