Jun, 2024

Llama3-70B-Instruct 的领域适应:连续预训练和模型合并的综合评估

TL;DR在金融监管数据集上,我们对 Meta-Llama-3-70B-Instruct 模型的领域适应性进行了广泛的实验,探索其在通用和特定领域基准上的性能。我们关注了持续预训练(CPT)和模型合并,旨在增强模型的特定领域能力,同时减轻灾难性遗忘。通过本研究,我们评估了将金融监管数据集整合到一个健壮的语言模型中的影响,并检验了我们的模型合并技术在保护和提高模型的指导能力方面的有效性。