Sep, 2023

ALLURE:一种用于迭代上下文学习的 LLM 文本评估的系统性审核和改进协议

TL;DRALLURE 是一种系统性方法,用于审计大型语言模型的理解和推理错误,通过比较 LLM 生成的评估与注释数据,并迭代地将显著偏差的实例纳入评估器,利用上下文学习(ICL)增强和改进 LLM 对文本的鲁棒评估,从而最终降低对人工注释者在评估过程中的依赖。预期 ALLURE 能在与文本数据评估和效率相关的各领域中服务多种 LLM 应用。