Mar, 2024

软虎:面向医疗工作流的临床基础模型

TL;DR我们介绍了 SoftTiger,这是一个临床大型语言模型(CLaM),旨在成为医疗保健工作流的基础模型。我们解决了将临床笔记按照国际互操作性标准转化为临床数据的关键问题,并通过公开和认证的临床数据进行了监督微调,使目标模型能够支持基本的临床任务,并学习执行更复杂的下游临床任务。此外,我们还解决了医疗保健背景中的模型挑战,并展示了 SoftTiger 在盲目对比评估中优于其他流行的开源模型和 GPT-3.5,与 Gemini-pro 相媲美,仅与 GPT-4 略有差距。我们相信,大型语言模型可能成为医疗保健数字化和民主化的一个基石,因此,我们公开发布了规模为 130 亿和 700 亿参数的 SoftTiger 模型,以及创新的可扩展评估的数据集和代码,希望对医疗保健行业做出重要贡献。