Oct, 2023

众所周知:众包和集成学习分类中的标签聚合

TL;DRCrowd-Certain 是一种在众包和集成学习分类任务中进行标签聚合的新方法,通过评估标注者的一致性和受训分类器,确定每个标注者的可靠性分数,并利用预测概率实现对未来样本数据的训练分类器的复用,大幅提升性能和计算效率。在对十个不同数据集进行了广泛评估后,Crowd-Certain 几乎在所有场景中优于现有的十种方法,提供更高的平均准确率、F1 分数和 AUC 率。另外,我们引入了两种现有置信度评估技术的变体,并通过两种评估指标(期望校准误差和 Brier 得分损失)对其进行了评估,结果表明 Crowd-Certain 在大部分数据集上具有更高的 Brier 得分和更低的校准误差,表明结果的校准更好。