May, 2024

图上主动学习中的不确定性

TL;DR基于节点分类的不确定性采样是主动学习策略,通过迭代地获取具有最高不确定性的数据点的标签,以提高机器学习模型的数据效率。本文首次对节点分类的不确定性采样进行了全面研究,我们超越了预测不确定性来评估不确定性采样,揭示了与其他主动学习策略之间的显著性能差距,并开发了基于数据生成过程的地面真实贝叶斯不确定性估计,证明了其在引导最佳查询中的有效性。在合成数据上验证了我们的结果,并设计了一种近似方法,不断优于其他真实数据集上的不确定性估计。基于此分析,我们将不确定性建模中的问题与现有方法联系起来,我们的分析有助于并引导了基于图的原则性不确定性估计的发展。