BriefGPT.xyz
Ask
alpha
关键词
evaluator llm
搜索结果 - 1
ALLURE:一种用于迭代上下文学习的 LLM 文本评估的系统性审核和改进协议
ALLURE 是一种系统性方法,用于审计大型语言模型的理解和推理错误,通过比较 LLM 生成的评估与注释数据,并迭代地将显著偏差的实例纳入评估器,利用上下文学习(ICL)增强和改进 LLM 对文本的鲁棒评估,从而最终降低对人工注释者在评估过
→
PDF
10 months ago
Prev
Next