Dec, 2023

SM70:一种用于医疗设备的大型语言模型

TL;DR我们引入了 SM70,这是一个具有 70 亿参数的大型语言模型,专门为 SpassMed 的品牌 JEE1 的医疗设备而设计,提供对医学领域问题更准确、更安全的响应。通过使用公开可得的 MedAlpaca 数据集中的约 800K 个数据条目对 SM70 进行调优,以 LLama2 70B 开源模型为基础,采用 QLoRA 技术进行微调。我们通过对 MEDQA - USMLE、PUBMEDQA 和 USMLE 这三个基准数据集的评估,与包括 LLama2 70B、Clinical Camel 70(CC70)、GPT 3.5、GPT 4 和 Med-Palm 在内的其他知名 LLM 进行对比,展示了 SM70 在处理一系列医学查询方面的能力,从基于 PubMed 摘要的事实性问题到复杂的临床决策情景。SM70 在 USMLE 和 PUBMEDQA 数据集中表现出色,显示出它作为临床决策支持和医学信息检索工具的潜力。尽管具有有希望的结果,但该论文也承认了 SM70 在与最先进的模型 GPT 4 相比的领域中的滞后,从而突出了进一步发展的需求,特别是在需要广泛的医学知识和复杂推理的任务中。