关于预测强化引导的自助法注释

May, 2024

A Note on the Prediction-Powered Bootstrap

Tijana Zrnic

TL;DRPPBoot is a bootstrap-based method that simplifies and expands the scope of prediction-powered inference to estimation problems without requiring asymptotic characterizations.

Abstract

We introduce ppboot: a bootstrap-based method for prediction-powered inference. ppboot is applicable to arbitrary →

ppboot bootstrap prediction-powered inference estimation problems asymptotic normality

发现论文，激发创造

基于贝叶斯预测的推断

基于有限的人工标记数据，预测引导推理（PPI）方法可以提高统计估计。我们提出了一个基于贝叶斯推理的 PPI 框架，可以方便地开发新的任务适用的 PPI 方法，包括针对离散回答和非线性评分的 autoraters 的改进方法。

May, 2024

PPI++：高效的预测驱动推理

基于小型标记数据集和通常远大于其的机器学习预测数据集，我们提出了 PPI++：一种计算轻量级的估计和推断方法。该方法自动适应可用预测的质量，生成易于计算的置信区间（对于任何维度的参数），始终改进传统的区间估计方法，仅使用了标记数据。PPI++ 建立在预测驱动的推断（PPI）的基础上，解决了相同的问题设置，并提高了其计算和统计效率。真实和合成实验证明了所提出改进的好处。

Nov, 2023

预测驱动的推论

提出了一种利用机器学习进行预测的统计推断框架，可有效计算均值、分位数、线性和逻辑回归系数的置信区间，适用于蛋白质组学、基因组学等多种领域。

Jan, 2023

基于分层预测的混合语言模型评估

基于有限的人工标注数据，利用预测增强推断 (Prediction-powered inference, PPI) 方法可以改善统计估计。Stratified Prediction-Powered Inference (StratPPI) 是一种通过简单的数据分层策略来改善基本的 PPI 估计的方法。它提供了一种基于分层采样的计算成簇样本参数（例如平均值）的有效置信区间的算法，可以在多种条件分布的目标数据中获得比非分层方法更紧密的置信区间。

Jun, 2024

用 Jackknife + 自助法进行预测推断是免费的

提出了一种基于 Jackknife + 和 Bootstrap 的预测区间构建方法 (J+aB)，该方法只使用可用的 Bootstrap 样本及其对应的拟合模型，可以在不假设数据分布，拟合模型的性质或集成模型聚合方式的情况下提供保证，并可以免费进行模型拟合，实验结果验证了预测区间的覆盖率和准确性。

Feb, 2020

大数据引导

本文提出了一种新的 BLB 算法，该算法融合了自助法和子采样的特点，以获得一种健壮、计算效率高的评估估计器质量的方法，适用于现代并行和分布式计算架构，保留了自助法的通用适用性、统计效率和有利的理论属性。

Jun, 2012

不变概率预测

近年来，对于在训练和测试数据之间分布变化下表现出鲁棒性能的统计方法引起了越来越多的关注。本文关注点预测的统计研究主要关注的是均方误差损失，而本文则将关注焦点转向概率预测，旨在全面量化给定协变量的结果变量的不确定性。我们在因果性启发框架下，研究了概率预测在适当评分规则下的不变性和鲁棒性。我们证明了任意的分布变化通常不具有不变且鲁棒的概率预测，与点预测的情况相反。我们通过说明如何选择评估指标并限制分布变化的类别，以实现在典型的高斯异方差线性模型中的可识别性和不变性。在这些发现的基础上，我们提出了一种能够产生不变概率预测的方法，称为 IPP，并研究了底层参数的一致性。最后，我们在模拟数据和单细胞数据上展示了我们提出的方法的实证表现。

Sep, 2023

可扩展贝叶斯加权自助法

本论文提出一种加权贝叶斯自助法（WBB）用于机器学习和统计学的不确定性量化，可通过对多维后验分布进行采样实现，计算速度快，可扩展性好，并对正则化回归、趋势滤波和深度学习等众多机器学习和统计模型进行了应用。

Mar, 2018

神经过程引导机器学习

提出一种基于引导法的神经过程扩展方法 Boostrapping Neural Process（BNP），可以在不假设特定形式情况下，学习 NPs 中的随机性，且在各类型数据中表现出良好的鲁棒性和稳健性

Aug, 2020

具有覆盖保证的神经网络快速、无分布预测推断

本文提出一种新颖、计算有效的算法来进行预测推断，其对数据没有分布假设，并且可以比基于引导类型的神经网络方法更快地计算。

Jun, 2023