Feb, 2024

BioMistral: 面向医学领域的一组开源的预训练大型语言模型

TL;DRBioMistral 是一个开源的、专门针对生物医学领域的大型语言模型,通过基于 Mistral 模型并在 PubMed Central 上进行进一步预训练来实现。我们在包含 10 个既定医疗问答任务的基准测试上对 BioMistral 进行了全面评估,同时探索了通过量化和模型合并方法获得的轻量级模型。我们的结果表明,与现有的开源医学模型相比,BioMistral 具有出色的性能,并且在与专有模型的竞争中有竞争优势。此外,为了解决英语以外数据的有限可用性,并评估医学领域中多语言的泛化能力,我们将该基准测试自动翻译和评估为其他 7 种语言。这标志着医学领域中大规模多语言评估的首次实现。在我们的实验中获得的数据集、多语言评估基准、脚本以及所有模型都可以免费获取。