Sep, 2024

教育价值观:评估大型语言模型的中国教育价值

TL;DR本研究解决了大型语言模型在中国教育价值观对齐方面的不足。提出了Edu-Values评估基准,通过设计1,418个问题,评估LLMs在专业意识、文化素养等七个维度的表现。研究发现,中国LLMs在教育文化背景下明显优于英语LLMs,并揭示了LLMs在教学技能方面表现良好但在教师职业道德和基本能力上存在不足。