AAAIApr, 2024

评估医疗 LLM 的微调策略:全参数 vs. 参数高效方法

TL;DR该研究对两种主要的微调方法 —— 全参数微调和参数高效微调 —— 在医学大型语言模型(LLM)领域进行了全面的分析和比较。通过开发和优化一系列基于 Llama-2 架构的医学 LLM,从而提升医学知识检索、推理和问答的能力,我们系统地评估了这些微调策略在各种知名医学基准测试上的有效性。值得注意的是,我们的医学 LLM Med42 在美国医学执照考试(USMLE)数据集上表现出了 72% 的准确率,为公开可用的医学 LLM 性能树立了新的标准。通过这种比较分析,我们旨在找到医学领域 LLM 微调的最有效和高效方法,从而在推动以人工智能驱动的医疗应用方面做出重大贡献。