动态 GNN 的有效符合性预测
本研究提出了一种基于置信度的图神经网络模型 CF-GNN,以保证模型的可靠性,所采用的置信度预测方法即为 conformal prediction,该方法可产生预测区间,该区间内包含了真值标签,该模型通过拓扑感知输出修正模型减少了预测集大小,从而实现了较高的预测精度。
May, 2023
使用图神经网络 (GNN) 方法进行边权重预测,利用符合性预测调整 GNN 输出并生成有效的预测区间,通过误差重新加权和符合化的分位数回归 (CQR) 处理数据异方差性,与基线技术在真实世界的交通数据集上相比,我们的方法具有更好的覆盖率和效率,展示了鲁棒性和适应性。
Jun, 2024
这篇论文介绍了一种无分布和无模型偏见的不确定性量化方法,用于构建基于 GNN 的链接预测的具有统计保证的预测区间,该方法在遵循幂律分布的图结构上显著提高了基线方法的有效性。
Jun, 2024
本文提出一种新的针对预测模型的 Conformal prediction 泛化方法,通过引入加权分位数来抵御数据分布漂移的影响,同时设计一种新的随机化技术,允许不对称处理数据点的算法。实验表明,该方法在数据点不可交换的情况下具有较高的鲁棒性,并且在数据点可交换情况下达到了与现有方法相同的覆盖率保证。
Feb, 2022
使用符合预测(conformal prediction)技术,此论文提出了一种用于解决图半监督学习中图神经网络(GNN)预测不确定性问题的方法,该方法还引入了一种新的损失函数来优化模型预测,并在标准图基准数据集上进行了验证。
May, 2024
机器学习系统中风险量化与控制的研究,集中在处理 ML 系统收集自身数据时产生的数据分布变化问题,通过扩展 conformal prediction 理论以适应任意数据分布,并提出了针对特定数据分布的可行算法,以解决这一挑战。
May, 2024
通过利用最近对非交换式依从预测的研究结果,我们提出了一种新的统一预测框架的扩展,名为非交换式依从核心采样,用于基于最近邻的生成。我们的方法可以后处理任意模型,提供具有统计保证的标记级预测集,并且在机器翻译和语言建模实验中展示了令人鼓舞的生成质量结果。通过产生更紧的预测集并实现良好覆盖率,我们从理论上给出了一种更有原则性的具有依从保证的抽样方法。
Feb, 2024
快速增长的大型语言模型和自然语言处理(NLP)应用对不确定性量化提出了关键需求,以减轻幻象等风险并提高关键应用中的决策可靠性。条件预测正在成为一个理论上健全且实用的框架,结合了灵活性和强有力的统计保证。它的模型无关性和无分布性质使其特别有希望解决源于 NLP 系统缺乏不确定性量化的现有缺点。本文对条件预测技术、其保证以及 NLP 中的现有应用进行了全面调研,指出了未来研究的方向和面临的挑战。
May, 2024
介绍一种无需分布假设或模型假设,可用于任何预训练模型(如神经网络)生成 100% 正确性置信区间(信赖区间)的方法, 称之为一致预测;并提供了 Python 示例代码和 Jupyter 笔记本来说明此方法在计算机视觉、自然语言处理和深度强化学习等领域上的应用。
Jul, 2021