Nov, 2023

ChiMed-GPT:具备全面训练机制且更符合人类偏好的中文医学大型语言模型

TL;DR近年来,对优质医疗服务的需求日益增长,凸显了医疗基础设施中的差异。随着大数据,特别是文本,成为医疗服务的基石,迫切需要专为医疗领域量身定制的有效自然语言处理(NLP)解决方案。我们提出了 ChiMed-GPT,这是一个专为中国医疗领域设计的新型基准大语言模型,其上下文长度扩展为 4,096 个标记,并经历了全面的预训练、有监督微调和强化学习高强度训练过程。在信息提取、问题回答和对话生成等真实世界任务中的评估结果表明,ChiMed-GPT 在医疗领域的性能优于一般领域的大语言模型。此外,通过要求 ChiMed-GPT 执行涉及对患者歧视的态度评定,我们分析了可能存在的偏见,以促进医疗领域大语言模型的负责任开发。代码和模型已经在此 URL 发布。