confidence intervals | BriefGPT

关键词confidence intervals

搜索结果 - 78

基于分层预测的混合语言模型评估
基于有限的人工标注数据，利用预测增强推断 (Prediction-powered inference, PPI) 方法可以改善统计估计。Stratified Prediction-Powered Inference (StratPPI) 是
PDFa month ago
同形性抑郁预测
通过引入基于符合预测的不确定性量化的符合抑郁预测方法（CDP），本研究展示了在抑郁识别中的不确定性量化应用，以及 CDP 和 CDP-ACC 在 AVEC 2013 和 AVEC 2014 数据集上的有效性和优越性。
PDFa month ago
递归 PAC-Bayes：一种在没有信息损失的情况下对顺序先验进行频率论更新的方法
PAC-Bayesian analysis allows sequential prior updates with no information loss and has significant improvements in empir
PDFa month ago
KDD隐藏混淆下的共形反事实推断
个性化决策需要对不同处理方法下的潜在结果有所了解，并且关于潜在结果的置信区间能够丰富决策过程并提高其在高风险场景下的可靠性。本研究提出了一种基于推断加权拟合预测的新方法 wTCP-DR，他能够在存在隐性混淆的情况下提供对反事实结果的置信区间
PDFa month ago
深度神经网络的可伸缩子采样推理
该研究论文介绍了深度神经网络的误差界限、基于可伸缩子抽样的估计器以及基于该估计器构建的置信区间和预测区间。这些方法在计算效率、点估计 / 预测准确性和实用的置信区间和预测区间等方面都具有很好的性能。
PDF2 months ago
基于贝叶斯预测的推断
基于有限的人工标记数据，预测引导推理（PPI）方法可以提高统计估计。我们提出了一个基于贝叶斯推理的 PPI 框架，可以方便地开发新的任务适用的 PPI 方法，包括针对离散回答和非线性评分的 autoraters 的改进方法。
PDF2 months ago
基于数据驱动的误差估计：无技术债务的多重错误上界
通过数据驱动的方法，我们提出了一个完全基于数据的途径来估计最大误差的上界，解决了构建多个同时有效置信区间的问题，并拓展了估计过程的应用领域。
PDF2 months ago
安哥拉兔规模化实验
Hoffmann et al.（2022）提出了三种估计计算最优缩放定律的方法，我们试图复制他们的第三个估计过程，其中涉及将参数损失函数拟合到从图表中重建的数据。我们发现所报道的估计与他们的前两种估计方法不一致，无法对提取的数据进行拟合，并
PDF3 months ago
多环境场景下的预测推理
在多个环境下进行预测的情况中，我们解决了构建有效置信区间和集合的挑战。通过扩展自助法和分割一致性方法，我们研究了适用于这些问题的两种覆盖类型，展示了如何在这些非传统的分层数据生成场景中获得无分布覆盖。我们还在非实数值响应的设置中进行了扩展，
PDF3 months ago
Conformalized-DeepONet：深度操作器网络中的无分布框架不确定性量化
采用符合预测方法的分布自由不确定性量化框架，获得具有覆盖保证的深度操作网络回归的置信度预测区间，并通过将符合预测与 Prob-DeepONet 和 B-DeepONet 相结合，有效地量化不确定性，生成严谨的深度操作网络预测的置信度区间，同
PDF4 months ago
线性回归的私有梯度下降：更紧凑的误差界限和特定实例的不确定性估计
我们对标准差分隐私梯度下降方法在线性回归中的分析进行了改进，得出基于输入的合理假设，在每个时间步骤上迭代的分布特征。我们的分析结果揭示了算法的准确性新的发现：对于适当选择的超参数，样本复杂度仅与数据维度呈线性关系。这与（非私有）普通最小二乘
PDF4 months ago
私密统计推断的重采样方法
通过构建隐私差分的置信区间，我们提出了两种非参数私有化自举方法，可以在数据的多个分区上私下计算多个 “小” 自举结果的中位数，并给出了对生成置信区间的渐近界限的错误率。对于固定的差分隐私参数 ε，我们的方法在样本量 n 中与非私有自举方法的
PDF5 months ago
符号扰动求和识别方法的样本复杂性：标量情况
Sign-Perturbed Sum (SPS) 是一种强大的有限样本系统辨识算法，可以为任何有限样本大小的真实数据生成系统构造具有确切覆盖概率的置信区间。本论文旨在填补这一研究空白，首次提供了关于 SPS 样本复杂度的结果，以及对于标量线
PDF5 months ago
AAAIMarkovian LSA 和统计推论中的恒定步幅的有效性
本研究通过线性随机逼近（LSA）算法与马尔可夫数据研究了使用恒定步长进行统计推断的有效性。通过建立中心极限定理（CLT），我们提出了一种使用平均 LSA 迭代构建置信区间（CIs）的推断过程。我们的方法利用恒定步长 LSA 的快速混合特性进
PDF7 months ago
SMURF-THP：基于得分匹配的变压器霍克进程不确定性量化
我们提出了 SMURF-THP，一种基于得分的学习方法，用于学习 Transformer Hawkes 过程并量化预测不确定性。通过学习到的得分函数，我们可以从预测分布中采样事件的到达时间，从而计算生成样本的置信区间，实现了对不确定性的量化
PDF8 months ago
高效不确定性量化：简易重采样随机梯度下降
通过采用分别基于重采样的多个随机梯度下降和在线方法，我们实现了对于随机梯度下降解的置信区间的构建，通过最近被称为廉价引导思想和 SGD 的 Berry-Esseen 型界限，我们显著减少了计算量，并绕过了现有分批方法中复杂的混合条件。
PDF9 months ago
有界均值的押注置信区间的近最优性
基于赌注方法构建的置信区间和置信序列在理论上具有更强的保证，无论是在渐近还是有限样本情况下，其经验证明在经验性能上优于现有的经验伯恩斯坦置信区间和置信序列。
PDF9 months ago
基于似然比的神经网络置信区间
该论文介绍了一种利用似然比方法构建神经网络置信区间的初步实现，提出了 DeepLR 方法，该方法具有限定数据区域扩展的不对称区间以及考虑训练时间、网络结构和正则化技术等因素的优势。尽管当前实现方式在许多深度学习应用中代价过高，但在医学预测或
PDFa year ago
无悔的多任务学习：从改进的置信界到主动学习
该研究提出了在缺乏任务相似性和任务特征的条件下，通过多任务学习获得的置信区间，可以有效地估计多个相关任务的不确定性，并且可以应用于在线学习中，进一步提出了一种新颖的多任务主动学习算法来同时优化多个任务，通过使用置信区间决定选择哪个任务进行查
PDFa year ago
3D 医学图像分割性能估计的置信区间
本研究以医学图像分割为背景，通过实验证明了参数置信区间与自助法估计值在不同测试集大小和性能度量传播范围下的合理性，同时揭示了相较于分类任务，医学图像分割所需的测试样本数量常常较低。
PDFa year ago