Aug, 2024

CMoralEval:中文大型语言模型的道德评估基准

TL;DR本文针对中文大型语言模型在道德相关背景下的表现,构建了一个名为CMoralEval的大规模道德评估基准,以填补现有研究中的空白。研究提出了一种结合传统文化与现代社会规范的道德分类法,并通过多元真实的数据源创建了包含近三万条道德实例的数据集。实验表明,CMoralEval是中文大型语言模型的一个具有挑战性的基准,具有重要的研究价值和应用潜力。