Feb, 2024

多个大型语言模型的综合洞察提高诊断准确性

TL;DR通过使用集体智能方法和 200 个真实病例的临床案例数据集,我们评估和比较了使用个别商业大型语言模型(OpenAI GPT-4、Google PaLM 2、Cohere Command、Meta Llama 2)提取的不同诊断与使用组合相同大型语言模型的回答合并后产生的不同诊断之间的准确性,结果发现聚合多个不同大型语言模型的回答能够更准确地产生不同诊断。