基于 PAC 神经预测集学习生成语言模型不确定性的量化

Jul, 2023

基于 PAC 神经预测集学习生成语言模型不确定性的量化

PAC Neural Prediction Set Learning to Quantify the Uncertainty of Generative Language Models

Sangdon Park, Taesoo Kim

TL;DR通过神经预测集模型以更准确地量化不确定性，本文提出的方法在四种语言数据集和六种模型上表现出 63% 的平均不确定性改进，相对于标准基准方法来说。

Abstract

uncertainty learning and quantification of models are crucial tasks to enhance the trustworthiness of the models. Importantly, the recent surge of →

uncertainty learning quantification of models generative language models neural prediction set models uncertainty quantification

发现论文，激发创造

通过校准预测为深度神经网络构建 PAC 置信集

我们提出了一种算法，将校准预测与从学习理论推导的泛化界限相结合，构建深度神经网络的置信集，具有 PAC 保证 —— 即给定输入的置信集具有很高的真标签概率。我们演示了如何在 ResNet for ImageNet、视觉对象跟踪模型和半猎豹强化学习问题的动态模型上使用我们的方法构建 PAC 置信集。

Dec, 2019

标签转移下的 PAC 预测集

使用一种新颖的算法，在标签偏移情境下构建具有 PAC 保证的预测集合，通过对目标领域的类别的预测概率和混淆矩阵进行估计，利用高斯消元算法传播这些估计的不确定性，计算重要性权重的置信区间，并利用这些区间构建预测集合。在几个基准数据集上评估我们的方法，证明该算法满足 PAC 保证，并且相较于几个基准算法，生成更小且更具信息量的预测集合。

Oct, 2023

自然语言处理任务中的不确定性量化

本论文提出了新方法来研究自然语言处理（NLP）任务中表征模型和数据不确定性的好处，通过在卷积和循环神经网络模型上的实证实验，展示了明确建模不确定性不仅有利于测量输出置信水平，而且对于提升各种 NLP 任务中的模型表现也是有用的。

Nov, 2018

协变量偏移下的 PAC 预测集

论文提出了一种新的、能够在存在协变量转移情况下构建可能准确的预测集的方法，该方法重点关注源分布与目标分布之间的协变量转移，假设给定了编码训练样本概率变化的重要性权重，从而实现了不确定性的量化。

Jun, 2021

图学习的不确定性量化：一项综述

对图形模型中的不确定性进行量化的最新方法进行了概述，并将其组织为不确定性表示和处理方法，以加深对图形模型中不确定性量化方法的理解，从而提高其在关键应用中的效果和安全性。

Apr, 2024

临床自然语言处理中的半监督学习自动数据标注中的分歧建模

本研究探讨预测模型在医疗健康领域中的应用，特别是自监督模式下标记数据的超拟合问题，发现高斯过程能够以较高的预测准确性评估指标和平均最大预测置信水平，对 3 种不确定性标签进行风险评估并保持强大的预测力。

May, 2022

超参数化神经网络的有效不确定性量化和减少

使用一种名为 PNC 预测器的方法，仅使用一个辅助神经网络，并结合适当的低计算重采样方法，以最低限度的开销建立了几种方法，利用仅四个训练网络就能构建渐近精确覆盖置信区间。

Jun, 2023

利用人工神经网络学习不确定性以改进预测性流程监控

研究了使用贝叶斯神经网络中的可学习不确定性来训练预测过程监控模型，以预测剩余时间和结果，并得出结论认为这种不确定性估计可以区分更精确和不太精确的预测，从而提高了用户对于这种预测系统的信心，在合作和以较小的数据集进行更早的实施方面具有潜在的可应用性。

Jun, 2022

神经状态空间模型：不确定性量化的实证评估

本研究应用 Bayesian 概率框架和近似推理技术，对神经状态空间模型进行不确定性量化，得出模型输出的可信区间和惊奇指数，以有效诊断模型在潜在危险的分布区域内的使用可能性。

Apr, 2023

图神经架构搜索中的分子性质预测不确定性量化

AutoGNNUQ 是一种自动化不确定性量化方法，通过生成一组高性能的图神经网络（GNNs）进行分子属性预测，实现对预测的不确定性的估计，并利用方差分解来提供减少不确定性的有价值见解。在多个基准数据集上的计算实验证明，AutoGNNUQ 在预测准确性和不确定性的性能方面优于现有的不确定性量化方法。此外，利用 t-SNE 可视化方法来探索分子特征与不确定性之间的相关性，为数据集的改进提供了见解。AutoGNNUQ 在药物发现和材料科学等领域具有广泛的应用价值。

Jul, 2023