Jan, 2025
揭示金融大语言模型的领域自适应后训练
Demystifying Domain-adaptive Post-training for Financial LLMs
TL;DR本研究针对金融领域大语言模型的领域自适应后训练面临的挑战,提出FINDAP作为一种系统化的研究方法。通过识别目标领域所需的核心能力并构建评估体系,研究提出一种基于新颖偏好数据蒸馏方法的有效训练方案,使得生成的模型Llama-Fin在多项金融任务中展现了卓越表现,从而为LLM的领域适应提供了重要的见解和解决方案。