Jun, 2024

小型代理也能出色!强化小型语言模型作为幻觉检测器

TL;DR通过使用较小型的语言模型以及多功能工具箱,设计了一个细粒度的三阶段检测框架,结合记忆机制,实现了HalullAgent,使其能够主动选择适合的工具来检测多种幻觉类型,包括文本、代码和数学表达式,并利用中英文数据集进行合成检测轨迹以实现双语幻觉检测。大量实验证明,仅使用2K样本进行调优,HaluAgent可以在各种任务和数据集上执行幻觉检测,在领域内和领域外数据集上实现与甚至超过GPT-4的性能而无需工具增强。