Apr, 2024

Bailong:基于 QLoRA 和 Zip-tie 嵌入的双语迁移学习

TL;DR我们结合参数高效调整和高级嵌入初始化技术,通过对英语主导的开源大语言模型进行二次预训练,以提高其在繁体中文上的表现,并进一步引入评估平台来检验模型与人类偏好和指令遵循能力的一致性。我们的评估结果显示,我们的模型在多轮对话任务中相比其他类似的开源模型表现出竞争性水平,并提供了 Bailong-instruct 7B 与 Bailong-bench 供社区使用。