Mar, 2024

小语言模型通过医学教科书学习提升的推理能力

TL;DRMeerkat-7B 是一个具有 70 亿参数的新型医疗人工智能系统,通过使用来自 18 本医学教科书的高品质推理路径和多样的指令跟随数据集进行训练,成功地在七个医学基准测试中取得了出色的准确性,在超过 GPT-3.5 13.1%的同时,还超过了先前的 7B 模型(如 MediTron-7B 和 BioMistral-7B)分别达到了 13.4%和 9.8%的性能,并且首次超过了 United States Medical Licensing Examination(USMLE)的 7B 参数模型通过阈值。此外,相比现有的 7B 和 13B 模型,我们的系统对临床问题提供了更详细的自由形式回答,接近于 GPT-3.5 的性能水平,这大大缩小了与大型语言模型之间的性能差距,展示了它在应对复杂的医学挑战方面的有效性。