Jul, 2024

TelecomGPT:用于构建电信领域大型语言模型的框架

TL;DR我们提出了首个针对电信领域的大规模语言模型(LLMs)的适应流程,并通过建立特定的预训练数据集,指令数据集和偏好数据集,分别进行连续预训练、指令微调和对齐微调来优化LLMs的性能。此外,我们提出了三个新的评估基准,即电信数学建模,电信开放性问答和电信代码任务,以综合评估LLMs在电信领域中的能力。我们的优化后的电信领域LLM TelecomGPT在电信数学建模基准中显著优于GPT-4,Llama-3和Mistral等先进模型,并在TeleQnA、3GPP技术文档分类、电信代码摘要和生成以及填充等各项评估基准中取得了可比较的性能。