Apr, 2024

SHROOM-INDElab 在 SemEval-2024 任务 6 中的零击中和少击中基于 LLM 的幻觉检测分类

TL;DR通过使用大型语言模型进行提示程序设计和上下文学习来构建大学智能数据工程实验室团队参与 SemEval-2024 任务 6 竞赛的 SHROOM-INDElab 系统,该系统在上下文特定任务、角色和目标概念的定义以及自动生成示例的基础上,扩展了对幻觉检测的分类器的先前工作,并在模型无关和模型感知的任务中获得了第四和第六的性能,与众包人工标注的验证集一致,发现零样本方法提供了比使用自动生成示例的 few-shot 方法更好的准确性。