预测驱动的推论
基于有限的人工标记数据,预测引导推理(PPI)方法可以提高统计估计。我们提出了一个基于贝叶斯推理的 PPI 框架,可以方便地开发新的任务适用的 PPI 方法,包括针对离散回答和非线性评分的 autoraters 的改进方法。
May, 2024
基于小型标记数据集和通常远大于其的机器学习预测数据集,我们提出了 PPI++:一种计算轻量级的估计和推断方法。该方法自动适应可用预测的质量,生成易于计算的置信区间(对于任何维度的参数),始终改进传统的区间估计方法,仅使用了标记数据。PPI++ 建立在预测驱动的推断(PPI)的基础上,解决了相同的问题设置,并提高了其计算和统计效率。真实和合成实验证明了所提出改进的好处。
Nov, 2023
基于有限的人工标注数据,利用预测增强推断 (Prediction-powered inference, PPI) 方法可以改善统计估计。Stratified Prediction-Powered Inference (StratPPI) 是一种通过简单的数据分层策略来改善基本的 PPI 估计的方法。它提供了一种基于分层采样的计算成簇样本参数(例如平均值)的有效置信区间的算法,可以在多种条件分布的目标数据中获得比非分层方法更紧密的置信区间。
Jun, 2024
以人工智能和机器学习为基础,本文研究了预测后推断问题的统计挑战,包括预测结果与真实结果之间的关系、机器学习模型对训练数据的鲁棒性以及将预测的偏差和不确定性传播到最终推断过程中。同时与传统领域的相关研究进行对比,揭示了设计在经典和现代推断问题中的作用。
Jan, 2024
这项研究介绍了一种无假设和数据自适应的后预测推断(POP-Inf)过程,能够基于机器学习预测的结果进行有效和有力的推断,并展示了其优越性和适用性通过模拟和大规模基因组数据。
Nov, 2023
基于可靠性和可问责性的指导原则,本文提出了一种模型无关的统计框架,用于不确定性量化和统计推断,通过预测集提供可控制第一类错误的有限样本控制方法,并提供了灵活的工具用于不确定性概率推理。
Jul, 2023
PPBoot is a bootstrap-based method that simplifies and expands the scope of prediction-powered inference to estimation problems without requiring asymptotic characterizations.
May, 2024