Oct, 2024

平衡持续预训练与指令微调:优化大型语言模型的指令遵循能力

TL;DR本研究旨在解决大型语言模型(LLMs)在持续预训练与指令微调之间的平衡问题,以保持最新的数据和准确的指令遵循能力。研究发现,通过持续预训练可以有效提升基础模型及其指令微调模型的指令遵循能力,而无需额外的指令数据和微调,展示了高计算效率的潜力。