MedMobile：具备专家级临床能力的移动型语言模型

Oct, 2024

MedMobile：具备专家级临床能力的移动型语言模型

MedMobile: A mobile-sized language model with expert-level clinical capabilities

Krithik Vishwanath, Jaden Stryker, Anton Alaykin, Daniel Alexander Alber, Eric Karl Oermann

TL;DR该研究解决了传统医疗语言模型在计算成本和隐私问题上的不足。提出了MedMobile，一种适用于移动设备的3.8亿参数语言模型，其性能超越了医生资格考试的及格线，显示出卓越的医学问答能力。最重要的发现是，通过思维链、集成和微调等方法，能显著提升模型表现。

Abstract

Language models (LMs) have demonstrated expert-level reasoning and recall abilities in medicine. However, computational costs and privacy concerns are mounting barriers to wide-scale implementation. We introduce a parsimonious adaptation of phi-3-mini, MedMobile, a 3.8 billion paramete

发现论文，激发创造

大型语言模型阐明人工医疗助理的进展路径：综述

通过综述大型语言模型在医学领域中的应用和意义，揭示了它们在知识检索、研究支持、临床工作流自动化和诊断辅助等方面的效用，并探索了多模态语言模型以及自动化代理在医疗保健中的发展潜力。然而，为了有效地将这些模型整合到临床实践中，需要不断优化和进行伦理监管。

Nov, 2023

MEDITRON-70B：用于大型语言模型的医学预训练扩展

通过发布具有7B和70B参数的开源LLMs套件MEDITRON，我们改进了对大规模医学LLMs的访问，并在多个医学测试中显示出显著的性能提升。与闭源LLMs相比，MEDITRON-70B在GPT-3.5和Med-PaLM上表现优异，并且与GPT-4和Med-PaLM-2相差不到5%和10%。

Nov, 2023

SM70：一种用于医疗设备的大型语言模型

我们引入了SM70，这是一个具有70亿参数的大型语言模型，专门为SpassMed的品牌JEE1的医疗设备而设计，提供对医学领域问题更准确、更安全的响应。通过使用公开可得的MedAlpaca数据集中的约800K个数据条目对SM70进行调优，以LLama2 70B开源模型为基础，采用QLoRA技术进行微调。我们通过对MEDQA - USMLE、PUBMEDQA和USMLE这三个基准数据集的评估，与包括LLama2 70B、Clinical Camel 70（CC70）、GPT 3.5、GPT 4和Med-Palm在内的其他知名LLM进行对比，展示了SM70在处理一系列医学查询方面的能力，从基于PubMed摘要的事实性问题到复杂的临床决策情景。SM70在USMLE和PUBMEDQA数据集中表现出色，显示出它作为临床决策支持和医学信息检索工具的潜力。尽管具有有希望的结果，但该论文也承认了SM70在与最先进的模型GPT 4相比的领域中的滞后，从而突出了进一步发展的需求，特别是在需要广泛的医学知识和复杂推理的任务中。

Dec, 2023

医疗领域中的大型语言模型: 一项综合基准评估

评估医疗领域中多样化的大型语言模型在七个任务和十三个数据集上的综合性能

Apr, 2024

医学中的大型语言模型综述

在这篇论文中，我们回顾了大型语言模型（LLMs）的发展，重点关注医学LLMs的需求和应用。我们提供了现有模型的简要概述，旨在探索进一步的研究方向并使其对未来医学应用产生益处。我们强调了医学LLMs在应用中的优势，以及其发展过程中遇到的挑战。最后，我们提出了技术整合的方向来减轻挑战，并为医学LLMs的未来研究方向提供了建议，旨在更好地满足医学领域的需求。

May, 2024

M-QALM: 通过问答评估大型语言模型在临床阅读理解和知识回忆方面的能力

研究了大型语言模型在临床和生物医学领域中与相关知识的召回和整合性方面的性能，发现指导调优等因素能够提高召回和理解能力，并展示了在医学知识数据集上进行直接微调的鼓舞人心的结果，为语言模型中的临床知识表示学习的进一步发展提供资源和标准方法论。

Jun, 2024

医学领域的大型语言模型综述：技术、应用、可信度与未来发展方向

综述医疗大型自然语言模型（Med-LLM）的进化历史、技术、应用以及对医疗保健的影响，涵盖临床决策支持、报告生成、医学教育等方面，探索其潜力和限制，并讨论公平性、责任感、隐私保护和鲁棒性等挑战，展望未来的发展方向。

Jun, 2024

药物查询的轻量级大型语言模型：Med-Pal

使用轻量级预训练大型语言模型（LLMs）开发的Med-Pal被证明在数字健康通信中具有可行性，通过微调和优化，Med-Pal可提供适合患者沟通的响应，并减少通常在一般LLMs中存在的偏差和错误。

Jul, 2024

生物医学中大型语言模型的调查

本研究针对现有生物医学领域大型语言模型(LLMs)文献缺乏综合分析的现状，进行了深入探讨。文章分析了484篇相关文献，探讨了LLMs在诊断辅助、药物发现和个性化医疗等任务中的能力，并指出在特定应用中提高模型表现的调适策略。此外，研究还揭示了数据隐私、模型可解释性等挑战，并提出未来的研究方向。

Aug, 2024

MEDIC：构建一个全面的框架以评估临床应用中的大型语言模型

该研究针对现有评估方法无法全面反映大型语言模型在临床应用中的表现这一问题，提出了一种新的评估框架MEDIC，涵盖医疗推理、伦理与偏见、数据与语言理解、情境学习和临床安全等五个关键维度。研究结果揭示了不同模型间的性能差异，为在特定应用中选择合适的模型提供了重要指导，确保在医疗行业中识别并调整最具潜力的模型以满足多样化需求。

Sep, 2024