Sep, 2023

通过自适应反向传播实现大规模语言模型微调中的绿色人工智能

TL;DR通过评估不同张量的反向传播成本和对精调模型准确性的贡献,选择最适合的张量集以最小化训练成本,并实现 FLOPs 的减少,GreenTrainer 技术相较于整个 LLM 模型的精调可节省高达 64% 的 FLOPs,同时不会显著降低模型准确性,相较于现有的技术如 LoRa,GreenTrainer 能在 FLOPs 减少的同时提高 4% 的模型准确性。