Apr, 2024

评估 ChatGPT 在门诊分诊指导中的应用:一项比较研究

TL;DR评估 ChatGPT 在门诊指导中提供的回复一致性,包括版本内回复分析和版本间比较,结果表明 ChatGPT-4.0 的内部回复一致性显著高于 ChatGPT-3.5,并且两者的最佳推荐都具有中等一致性。然而,版本间的一致性相对较低,指示两个版本之间几乎没有匹配的推荐。此外,只有 50%的最佳推荐在比较中完全匹配。ChatGPT-3.5 的回复更可能是完整的,相较于 ChatGPT-4.0,这表明两个版本之间存在信息处理和回复生成的可能差异。这些发现提供了关于 AI 辅助门诊运作的见解,同时也促进了对 LLM 在医疗利用中的潜力和限制的探索。未来的研究可能会根据人体工程学和人因原则,精确地根据有效门诊分诊的特定需求,谨慎优化 LLM 和 AI 在医疗系统中的整合。