麒麟医：多阶段知识注入的先进医疗大型语言模型

Oct, 2023

麒麟医：多阶段知识注入的先进医疗大型语言模型

Qilin-Med: Multi-stage Knowledge Injection Advanced Medical Large Language Model

Qichen Ye, Junling Liu, Dading Chong, Peilin Zhou, Yining Hua...

TL;DR将大型语言模型（LLMs）整合到医疗保健中存在潜力但也面临挑战。我们提出了一种多阶段训练方法，结合了专业域持续预训练（DCPT）、监督微调（SFT）和直接偏好优化（DPO），并引入一个包含医疗问答、纯文本、知识图谱和对话的 3Gb 中医数据集。通过我们的训练流程，医学 LLM（Qilin-Med）表现出显著的性能提升，突破了 Baichuan-7B 在 CMExam 上的准确率，并在 Huatuo-26M 测试集上超过了 SFT 的性能，在 BLEU-1 和 ROUGE1 上分别达到 16.66 和 27.44。这凸显了我们的训练方法在医疗应用中优化 LLMs 的优势。

Abstract

Integrating large language models (LLMs) into healthcare presents potential but faces challenges. Directly pre-training LLMs for domains like medicine is resource-heavy and sometimes unfeasible. Sole reliance on

large language models healthcare training method chinese medicine dataset medical applications

发现论文，激发创造

中荆：通过专家反馈和实际多轮对话提升大型语言模型的中医能力

该研究论文介绍了一个基于中医的大型语言模型，通过从事前训练到强化学习与人类反馈（RLHF）的整个训练流程，以及引入一个包含 7 万个真实医患对话的中文多轮医疗对话数据集 CMtMedQA，该模型在多个方面超越了基线模型，并且通过对该模型的进一步改进来提高其指令遵循能力和安全性。

Aug, 2023

ChiMed-GPT：具备全面训练机制且更符合人类偏好的中文医学大型语言模型

近年来，对优质医疗服务的需求日益增长，凸显了医疗基础设施中的差异。随着大数据，特别是文本，成为医疗服务的基石，迫切需要专为医疗领域量身定制的有效自然语言处理（NLP）解决方案。我们提出了 ChiMed-GPT，这是一个专为中国医疗领域设计的新型基准大语言模型，其上下文长度扩展为 4,096 个标记，并经历了全面的预训练、有监督微调和强化学习高强度训练过程。在信息提取、问题回答和对话生成等真实世界任务中的评估结果表明，ChiMed-GPT 在医疗领域的性能优于一般领域的大语言模型。此外，通过要求 ChiMed-GPT 执行涉及对患者歧视的态度评定，我们分析了可能存在的偏见，以促进医疗领域大语言模型的负责任开发。代码和模型已经在此 URL 发布。

Nov, 2023

医学问题回答中领域特定语言模型的持续训练和微调

使用连续训练和指导微调的方法，快速适应中国医学领域的 Llama 2 基础模型，实验证实了该方法的有效性，产生了与 GPT-3.5-turbo 相媲美的模型，并且使用更少的计算资源。这个领域特定模型对于各种中国医学应用是有用的，并为领域特定训练提供了一个模板，用于那些预训练模型缺乏所需专业知识的领域，如法律、科学和工程。

Nov, 2023

TCM-GPT：中医领域自适应大型语言模型的高效预训练

我们提出了一种新颖的领域特定的中医数据自适应方法，通过使用领域特定语料库对模型进行高效预训练和微调，实现与中医相关任务的高效对齐。我们在两个中医任务上进行了广泛的实验，TCM-GPT-7B 在准确性方面表现最好，分别在准确性上相对增加了 17% 和 12%，在 TCM 领域中验证了拥有 70 亿参数的大型语言模型的领域自适应效果。

Nov, 2023

儿科 GPT：用于儿科应用的大型语言模型作为中国医学助手

通过创建高质量数据集 PedCorpus 和应用系统性和稳健的训练流程构建了中国首个儿科大型语言模型助手 PediatricsGPT，以改善诊断效率，解决中国医疗资源匮乏的问题。

May, 2024

HuatuoGPT-II, 一阶段训练于医学领域的语言模型适应

通过将异构数据转化为统一的简单输入输出对格式，我们提出了一种简化学习协议的方法，用于解决领域适应中的挑战，并验证了这种方法在中医领域的性能优越性，开发的 HuatuoGPT-II 模型在中医领域的表现最优，不仅显示出了其有效性，还展示了其泛化能力。

Nov, 2023

Aqulia-Med LLM：全过程开源医疗语言模型的开创性

提出 Aquila-Med：一种基于 Aquila 的双语医学 LLM，通过持续预训练、监督微调以及强化学习从人类反馈中进行训练，解决医学领域中开源社区性能的问题，并在单轮对话、多轮对话和医学多项选择题方面取得显著成果。

Jun, 2024

DISC-MedLLM: 连接通用大型语言模型与真实世界医学咨询

提出了 DISC-MedLLM，一种综合的解决方案，利用 Large Language Models（LLMs）在端到端的对话式医疗服务中提供准确和真实的医疗回应。

Aug, 2023

Qilin-Med-VL: 面向通用医疗的中文大规模视觉语言模型

该研究介绍了 Qilin-Med-VL，首个中文大型视觉语言模型，旨在集成对图文数据的分析，通过预训练的 Vision Transformer 和基础语言模型的两阶段课程训练过程增强了生成医学字幕和回答复杂医学查询的能力，同时发布了由超过 1M 个图文对组成的 ChiMed-VL 数据集，可用于对医学数据进行详细和全面的解释。

Oct, 2023

DoctorGLM：细调您的中文医生并非力大无比的任务

该研究旨在解决大型语言模型在医学领域的准确性问题，通过采集汉语医学对话数据库并使用一些技术训练了易于部署的的 ChatGLM-6B 模型，最终可以以较低的成本实现健康医疗目的的 LLM。

Apr, 2023