Panda LLM: 开源中文指令模型的训练数据和评估

May, 2023

Panda LLM: 开源中文指令模型的训练数据和评估

Panda LLM: Training Data and Evaluation for Open-Sourced Chinese Instruction-Following Large Language Models

Fangkai Jiao, Bosheng Ding, Tianze Luo, Zhanfeng Mo

TL;DR该研究关注于通过指令调整和提供全面的性能评估来增强开源大型语言模型，探讨各种训练数据因素，如数量、质量和语言分布，如何影响用于英语和中文语言的公开高质量指令数据集训练的指令调整模型的性能，目的是通过量化分析为开源聊天模型的持续进步提供有价值的见解，我们的模型、数据和代码可供其他人使用和构建。

Abstract

This project focuses on enhancing open-source large language models through instruction-tuning and providing comprehensive evaluations of

Panda LLM: 开源 中文指令模型 的训练数据和评估

Panda LLM: 开源中文指令模型的训练数据和评估