Mar, 2025

中医三维评估:评估大型语言模型在传统中医学中的回应的三轴基准

TL;DR本研究针对大型语言模型在传统中医学评估不足的问题,提出了TCM-3CEval基准,评估模型在核心知识、经典文本理解和临床决策三个维度的表现。研究发现,具备中文语言和文化背景的模型在经典文本解读和临床推理方面表现更佳,TCM-3CEval为中医领域的AI评估设定了标准,为优化大型语言模型提供了有价值的见解。