Jun, 2024

TCMBench:中医药领域大型语言模型综合评估基准

TL;DR介绍了 TCM-Bench 综合评估 TCM 中大型语言模型性能的基准,提出了 TCMScore 作为评估 TCM 问题回答质量的指标,并从不同角度进行了综合实验分析,突出了大型语言模型在 TCM 领域的能力和局限性。