Jun, 2023

在 CMExam 上对大型语言模型进行基准测试 —— 一份综合的中文医学考试数据集

TL;DR通过引入 CMExam 数据集,该研究在医学领域中解决了对大型语言模型进行评估的挑战,同时还通过对 CMExam 的深入分析,详细介绍了 LLMs 在中国医学中的表现和挑战。