May, 2024

指令 CP:将大型语言模型快速转换为目标语言

TL;DR通过 Instruction Continual Pre-training (InsCP) 的方法,可以在维持对话能力的同时,将大型语言模型(LLMs)调整为适应其他语言,从而避免对有害内容过滤的能力下降,且只需要 0.1 十亿个高质量的指令遵循数据的资源消耗相对较低。