Apr, 2024

SmurfCat 参加 SemEval-2024 任务 6:利用合成数据进行幻觉检测

TL;DR我们在 SemEval-2024 妄想检测任务中开发了新的系统,通过比较模型预测与参考标准,使用多种基线、通过监督学习改进预训练编码器以及使用几个高性能模型的集成方法,我们介绍了三种不同的方法,表现出强大的性能指标,并通过生成额外的训练样本来增加训练数据,此外,还提供了详细的比较分析,值得注意的是,我们的首要方法在比赛的模型无关轨道中获得了可称赞的第 9 名,模型感知轨道中获得了第 17 名,突显了其有效性和潜力。