May, 2024

借助 LLMs 促进整体评估:基于情景实验的见解

TL;DR探索利用大型语言模型(LLM)作为促进多样评估的工具,实验表明 LLM 有效地促进师资讨论,具备从单一场景中泛化和创建评估标准的能力。