基于数据自适应的假设简化和预测后推理

Nov, 2023

基于数据自适应的假设简化和预测后推理

Assumption-lean and Data-adaptive Post-Prediction Inference

Jiacheng Miao, Xinran Miao, Yixuan Wu, Jiwei Zhao, Qiongshi Lu

TL;DR这项研究介绍了一种无假设和数据自适应的后预测推断（POP-Inf）过程，能够基于机器学习预测的结果进行有效和有力的推断，并展示了其优越性和适用性通过模拟和大规模基因组数据。

Abstract

A primary challenge facing modern scientific research is the limited availability of gold-standard data which can be both costly and labor-intensive to obtain. With the rapid development of machine learning (ML),

gold-standard data machine learning post-prediction inference statistical inference genomic data

发现论文，激发创造

我们真的需要数据吗？

以人工智能和机器学习为基础，本文研究了预测后推断问题的统计挑战，包括预测结果与真实结果之间的关系、机器学习模型对训练数据的鲁棒性以及将预测的偏差和不确定性传播到最终推断过程中。同时与传统领域的相关研究进行对比，揭示了设计在经典和现代推断问题中的作用。

Jan, 2024

任务无关的机器学习辅助推理

通过机器学习辅助分析和统计学方法的结合，我们提出了一种新的统计框架，用于无任务限制的机器学习辅助推理，可有效实施预测后推理，适用于各种分析框架和实际应用。

May, 2024

预测驱动的推论

提出了一种利用机器学习进行预测的统计推断框架，可有效计算均值、分位数、线性和逻辑回归系数的置信区间，适用于蛋白质组学、基因组学等多种领域。

Jan, 2023

基于交叉预测的推理

通过交叉预测方法进行有效机器学习推断，通过利用小规模标记数据集和大规模未标记数据集，来修正预测不准确性和潜在偏见，并获得更强大且置信区间更稳定的推断结果。

Sep, 2023

主动统计推理

活跃推理是一种与机器学习辅助数据收集相结合的统计推理方法，它通过在有限的标签收集预算下，利用机器学习模型识别哪些数据点最有利于标记，从而有效地利用资源。

Mar, 2024

PPI++：高效的预测驱动推理

基于小型标记数据集和通常远大于其的机器学习预测数据集，我们提出了 PPI++：一种计算轻量级的估计和推断方法。该方法自动适应可用预测的质量，生成易于计算的置信区间（对于任何维度的参数），始终改进传统的区间估计方法，仅使用了标记数据。PPI++ 建立在预测驱动的推断（PPI）的基础上，解决了相同的问题设置，并提高了其计算和统计效率。真实和合成实验证明了所提出改进的好处。

Nov, 2023

基于贝叶斯预测的推断

基于有限的人工标记数据，预测引导推理（PPI）方法可以提高统计估计。我们提出了一个基于贝叶斯推理的 PPI 框架，可以方便地开发新的任务适用的 PPI 方法，包括针对离散回答和非线性评分的 autoraters 的改进方法。

May, 2024

自适应数据分析中维护统计学有效性

关于如何在自适应数据分析中保证统计推断的有效性的研究，使用隐私保护技术协调估计值，并在估计指数数量的期望时取得了指数级的改进，适用于多重假设检验和虚假发现率控制。

Nov, 2014

预测后的有效推理

该研究提出一种基于先前训练过的机器学习模型进行预测并且进一步推断的方法，并对现有方法的局限性进行了研究，发现提出的方法能够有效控制误差率和提供正确置信区间。

Jun, 2023

推断时间采样量化预测不确定性

通过后处理的抽样策略估计数据不确定性，该方法可用于任何前馈确定性网络，能生成多样化的预测分布，并与预测误差有着良好的相关性。

Aug, 2023