Nov, 2023

在眼科中评估大型语言模型

TL;DR本研究评估了三个不同的大型语言模型(GPT-3.5、GPT-4 和 PaLM2)在回答眼科专业问题方面的表现,并将其与三个不同的专业人员群体(医学本科生、医学硕士和主治医师)进行了比较。结果显示,GPT-4 代表的 LM 在眼科领域表现更好,未来在医学教育和临床决策方面将带来意想不到的好处。