带预测的不确定性下的排序和超图定向
通过实验得出以下结论:(a)小n足以实现精度与近乎完美近似值相当, (b) 当任务变得更加具有挑战性时,大的n会带来更多益处, (c) 对于那些成对交互不太能够说出高阶交互的数据集,在降为两两抽象时,将失去很多精度。
Jan, 2020
本研究主要研究在嘈杂观测下,在图上定义“爬山友好型”函数的样本复杂度。作者提出了一个凸性的概念,利用最佳臂识别的变种,可以在少量查询后找到近似最优解。对于具有局部极值并且接近凸性的函数,作者证明了在噪声观测下经典模拟退火的样本复杂度。作者在图基邻近分类和文档重新排序应用问题上,展示了贪心算法和带重启的模拟退火的有效性。
Jun, 2020
本文基于两种算法(一个可直接恢复出真实标签,另一个则可以在标注标签子集的情况下可靠地推断出大型实例集的真实标签)从而开发利用配对比较查询可在指数级减少标签复杂性的方法,用于众包PAC学习阈值函数的设定,并在保留整体查询复杂性和运行时间的同时,可以成功地处理来自可能反对者的注释。
Nov, 2020
从节点特征中推断出具有内在关系的有意义的超图结构,并通过概率建模推导出超图结构和节点特征之间的关系,从而实现了无监督推理方法来估计每个潜在超边的概率。实验结果表明,我们的方法在从数据中更高效地学习有意义的超图结构方面优于现有的超图结构推断方法。
Aug, 2023
通过学习增强算法的角度探索排序问题,其中算法利用可能存在错误的预测来提高效率。我们考虑了两种不同的情境:在第一种情境中,为每个项目提供了其在已排序列表中的位置预测;在第二种情境中,我们假设存在一种“快速但不精确”的方法来比较项目,除此之外还有慢而准确的比较。对于这两种情境,我们设计了新的简单算法,仅使用O(Σi log ηi)个精确比较,其中ηi是第i个元素的适当定义的预测误差。特别是,随着预测质量的下降,比较次数从O(n)平滑地降低到O(nlogn)。我们证明在所考虑的误差度量方面,比较复杂度在理论上是最优的。与现有的自适应和非自适应排序算法进行的实验评估表明了在排序任务中应用学习增强算法的潜力。
Nov, 2023
我们的研究考虑了排名函数:将分类任务的个别预测映射为排名分布,重点关注对预测扰动的稳定性以及对个体和子群体的公平性。我们展示了最近提出的基于不确定性的排名函数在稳定性方面的表现,并且通过与多准确预测或多校准预测器的成功组合,实现了多组公平性。我们的研究表明,基于不确定性的排名在组和个体级公平性保证之间自然插值,并且同时满足在使用机器学习预测时重要的稳定性要求。
Feb, 2024
基于节点分类的不确定性采样是主动学习策略,通过迭代地获取具有最高不确定性的数据点的标签,以提高机器学习模型的数据效率。本文首次对节点分类的不确定性采样进行了全面研究,我们超越了预测不确定性来评估不确定性采样,揭示了与其他主动学习策略之间的显著性能差距,并开发了基于数据生成过程的地面真实贝叶斯不确定性估计,证明了其在引导最佳查询中的有效性。在合成数据上验证了我们的结果,并设计了一种近似方法,不断优于其他真实数据集上的不确定性估计。基于此分析,我们将不确定性建模中的问题与现有方法联系起来,我们的分析有助于并引导了基于图的原则性不确定性估计的发展。
May, 2024
图结构数据中对不确定性进行量化,特别是对(半监督)节点分类中的预测不确定性进行量化的问题已被解决。我们提出了一种新的方法,通过利用图拓扑提供的结构信息,用狄利克雷分布的混合物表示(认识论)不确定性,并引用线性观点汇聚的已建立原理,在邻居节点之间传播信息。我们通过一系列实验在各种图结构数据集上展示了这种方法的有效性。
Jun, 2024
本研究解决了在图数据中定义预测不确定性的具体问题,提出了一种新的CUQ-GNN方法,结合了标准图神经网络与基于后验网络的NFs不确定性估计,能够更灵活地适应领域特定的不确定性估计需求。研究表明,CUQ-GNN在节点分类基准测试中,相较于传统方法,能够有效生成有用的不确定性估计。
Sep, 2024