Aug, 2024

面向医疗的大型语言模型评估与构建

TL;DR本研究提出了MedS-Bench,旨在评估大型语言模型在临床环境中的表现,填补了现有基准的不足。通过开发MedS-Ins数据集,我们为医学领域提供了大量指令微调的数据,能够有效提升模型在复杂临床任务上的表现。我们的成果不仅展示了MMedIns-Llama 3的优越性,还通过公开数据集促进了医疗领域的进一步研究与发展。