OncoGPT: 一个基于大型语言模型元人工智能（LLaMA）的医学对话模型，专注于肿瘤学领域专业知识

Feb, 2024

OncoGPT: 一个基于大型语言模型元人工智能（LLaMA）的医学对话模型，专注于肿瘤学领域专业知识

OncoGPT: A Medical Conversational Model Tailored with Oncology Domain Expertise on a Large Language Model Meta-AI (LLaMA)

PDF

Fujian Jia, Xin Liu, Lixi Deng, Jiwen Gu, Chunchao Pu...

TL;DR开发了一种专用语言模型，通过在医生患者平台上清洗和匿名化的癌症相关对话数据集进行迭代微调，提高了模型对患者查询的理解和提供癌症相关建议的可靠性。

Abstract

In the past year, there has been a growing trend in applying Large Language Models (LLMs) to the field of medicine, particularly with the advent of advanced language models such as ChatGPT developed by OpenAI. However, there is limited research on LLMs specifically addressing

large language models medicine oncology-related queries specialized language model oncology

发现论文，激发创造

乳腺癌肿瘤的大型语言模型流水线

使用 Langchain 提示工程流程，Fine-tune 基于临床数据和临床指南文本语料库的先进 OpenAI 模型，实现了对乳腺癌患者的辅助放疗和化疗的高准确率（0.85+）分类。通过从人类肿瘤学家的观察数据建立信心区间，估计模型必须在治疗预测中超过原始肿瘤学家的比例为 8.2％至 13.3％。尽管肿瘤治疗决策结果的不确定性，但未来研究，可能是临床试验，需要确定这一阈值是否被模型满足。然而，因为 85％的美国癌症患者在本地社区设施接受治疗，这些模型在扩大获取质量护理的同时，最小程度上接近人类肿瘤学家将发挥重要作用。

Jun, 2024

ChatDoctor：一个使用医疗领域知识对 LLaMA 模型进行微调的医疗聊天模型

本论文提出了将现有的语言模型细调为医疗领域的医生 - 患者对话模型，以更好地理解患者需求、为医疗领域提供有价值的帮助，并将进一步开源相关数据、代码和模型来推进医疗领域的对话模型的发展。

Mar, 2023

癌症 LLM：一个癌症领域的大型语言模型

该研究提出了 CancerLLM 模型，该模型具有 70 亿个参数和 Mistral 风格的架构，预先训练了 2,676,642 份临床笔记和 515,524 份病理报告，涵盖了 17 种癌症类型，并在三个与癌症相关的任务上进行了微调，包括癌症表型提取、癌症诊断生成和癌症治疗计划生成。评估结果表明，CancerLLM 相对于其他现有的语言模型取得了最先进的结果，平均 F1 得分提高了 8.1％。此外，CancerLLM 在两个提出的鲁棒性测试中表现优于其他模型，这表明 CancerLLM 可以有效应用于临床 AI 系统，增强了癌症领域的临床研究和医疗服务。

Jun, 2024

RadOnc-GPT：一种针对放射肿瘤学的大型语言模型

本文提出了 RadOnc-GPT，这是一个专为放射肿瘤治疗而设计的大型语言模型，通过先进的调优方法进行专项调优。RadOnc-GPT 在 Mayo Clinic 的放射肿瘤学患者记录和临床笔记的大型数据集上进行了微调。该模型在三个关键任务上进行了指令调优，包括生成放射治疗方案、确定最佳放射疗法，以及根据患者诊断详情提供诊断描述 / ICD 代码。将 RadOnc-GPT 生成的输出与通用大型语言模型的输出进行比较的放射肿瘤学家评估显示，RadOnc-GPT 的输出在清晰度、特异性和临床相关性方面有显著改善。本研究证明了使用像 RadOnc-GPT 这样通过领域特定知识进行调优的大型语言模型，在放射肿瘤学等高度专业的医疗领域实现转型能力的潜力。

Sep, 2023

评估大型语言模型在高度专业化主题放射肿瘤物理学上的应用

本研究研究使用 LLMS 答题的能力。我们开发了一个包含 100 个肿瘤放射物理学问题的考试，将四个 LLM（ChatGPT（GPT-3.5），ChatGPT（GPT-4），巴德（LaMDA）和 BLOOMZ）与医学物理学家和非专业人员进行了评估。ChatGPT（GPT-4）平均表现优于所有其他 LLM 以及医学物理学家。ChatGPT（GPT-4）在被激发先解释，然后再回答的情况下表现得更好。ChatGPT（GPT-4）展示了出人意料的准确性，表明了一种新颖的推理能力，但存在固有属性以及无法通过大多数投票进一步提高得分。

Apr, 2023

Me LLaMA: 基于大型语言模型的医疗应用基础

这项研究介绍了 Me LLaMA，这是一个医学领域的大型语言模型（LLM）家族，包括基础模型 Me LLaMA 13/70B 和增强聊天版本 Me LLaMA 13/70B-chat。通过在大型医学数据上进行持续预训练和指导调整，Me LLaMA 模型在医学任务上表现优于其他医学 LLMs，适用于医学人工智能应用。

Feb, 2024

MedAlpaca -- 医疗对话人工智能模型和训练数据的开源集合

本文介绍了一个专门为医学应用 fine-tune 的数据集，并探究 fine-tuning 对于模型性能的影响，通过模型性能对比，论证 fine-tuned 模型在医学考试认证中的优越性。

Apr, 2023

通用到医疗应用的大型语言模型调查：数据集、方法论和评估

大型语言模型（LLMs）在各种自然语言处理任务中表现出令人惊讶的性能。最近，结合领域特定知识的医学 LLMs 在医疗咨询和诊断方面展现出卓越能力。本文系统地探讨了如何基于通用 LLMs 训练医学 LLMs，并提供了指导各种医学应用的 LLMs 发展的方法。

Jun, 2024

MedLM：探索面向医学问答系统的语言模型

本研究通过比较一般性和专用于医学问答的精简语言模型的性能，旨在填补这方面的空白，并评估不同语言模型家族的性能，以探讨这些模型在医学问答领域的可靠性、比较性能和有效性，从而为不同语言模型在医学领域的特定应用提供有价值的见解。

Jan, 2024

RO-LLaMA：通过噪声增强和一致性正则化实现放射治疗的综合型医学语言模型

近期人工智能在医疗领域有了显著进展，本研究提出 RO-LLaMA，一个通用的大型语言模型，特为放射肿瘤学领域量身定制，能够在临床报告总结、放疗方案建议等任务中表现出卓越的性能，并且通过 CEFTune 技术进一步提高了模型的鲁棒性，同时保持了处理干净输入的能力，还将此概念创造性地转化为 LLM 驱动的分割框架 CESEG。实验结果表明，RO-LLaMA 在多中心队列数据集上展现了出色的性能和泛化能力。

Nov, 2023