BriefGPT.xyz
Ask
alpha
关键词
checkeval
搜索结果 - 1
CheckEval: 通过检查清单使用大型语言模型进行鲁棒评估框架
CheckEval 是一个使用大型语言模型的新型评估框架,通过将评估标准细分为详细的子方面,并构建每个方面的布尔问题清单,以简化评估过程中的模棱两可性和不一致性。该方法不仅使过程更具可解释性,还通过专注于特定的评估维度,显著提高了结果的健壮
→
PDF
3 months ago
Prev
Next