Sep, 2023
ChatGPT-3.5 和 GPT-4 在美国医疗执照考试中的表现 —— 带与不带干扰的比较
Performance of ChatGPT-3.5 and GPT-4 on the United States Medical Licensing Examination With and Without Distractions
Myriam Safrai, Amos Azaria
TL;DR研究试图调查医学数据与闲聊混合对 ChatGPT 提供的医疗建议准确性的影响,结果显示 ChatGPT-4 的准确性比 3.5 版本更高,并且似乎闲聊不会影响其提供医疗建议的能力,这对于理解利用 ChatGPT 和其他 LLM 进行医患互动的潜力和限制是重要的第一步。