Apr, 2024

评估中型语言模型在临床问答中的潜力

TL;DR比较了大型语言模型和中型开源模型在临床任务上的表现,发现 Mistral 7B 是表现最佳的模型,并且在临床问题回答任务和消费者查询回答任务上优于专门为生物医学领域训练的模型。