在线预测线性回归

Jun, 2009

On-line predictive linear regression

Vladimir Vovk, Ilia Nouretdinov, Alex Gammerman

TL;DR通过在线协议，本文针对线性回归问题中的预测版本进行了研究，提出了一种预测方法，能够在参数估计之前找到相关的预测间隔，最终得到的错误率符合预期的统计波动性。

Abstract

We consider the on-line predictive version of the standard problem of linear regression; the goal is to predict each consecutive response given the corresponding explanatory variables and all the previous observations. The standard treatment of prediction in linear regression analysis

linear regression prediction intervals on-line protocol parameter estimation statistical fluctuations

发现论文，激发创造

多元线性回归模型的留一法预测区间

研究了基于留一残差的预测区间在线性回归模型中的应用，该模型的解释变量个数可以比样本大小还大。在对未知错误分布和高维设计做出最小的假设的情况下，建立了所提出区间的统一渐近有效性。预测区间可适用于许多线性预测器，如强健 M 估计量、James-Stein 类估计量以及像 LASSO 的惩罚估计量。这些结果表明，尽管重新采样程序在对未知参数进行推理时存在严重问题，但留一出方法仍可以成功应用于高维数据，以获得可靠的预测推断。

Feb, 2016

在线回归竞争与再生核希尔伯特空间

研究了使用一种新的预测算法在无需假设标签与对象的生成方式的条件下，对已知标签对象的实时预测问题，通过比较此算法与一定范围内的预测规则，证明了此算法的误差率在极限范围下可达到最佳状态，可用于无参统计学的普适预测。

Nov, 2005

通过顺序预测器获得高概率风险边界

在线学习方法在最小假设下产生顺序遗憾界限，并为统计学习提供期望风险界限；然而，最近的研究结果表明，在许多重要情况下，遗憾界限可能无法保证统计背景下紧致的高概率风险界限。本研究通过将通用在线学习算法应用于在线到批次转换，通过对定义遗憾的损失函数进行一般的二阶校正，获得了几个经典统计估计问题（如离散分布估计、线性回归、逻辑回归和条件密度估计）的几乎最优的高概率风险界限；我们的分析依赖于在线学习算法的不恰当性，因为它们不限制使用给定参考类别的预测器；我们的估计器的不恰当性使得在各种问题参数上显著改善了依赖；最后，我们讨论了我们的顺序算法与现有批处理算法之间的一些计算上的优势。

Aug, 2023

在线非参数回归

基于顺序熵，确立了在线回归的最佳速率，发现最佳速率具有类似于独立同分布 / 统计学习情况的相变。此外，展示了一种享有建立的最佳速率的通用预测器和一种设计在线回归算法且计算高效的方法。

Feb, 2014

序列数据的不变因果预测

本文提出了一种方法来从时间序列数据中推断出因果关系，该方法能够识别因果预测变量并保持环境和异质性模式不变。

Jun, 2017

预测区间的判别式学习

本文提出了一种区分学习框架，它在区间大小预算约束下，优化预期错误率，以构建归纳批处理中的预测区间。通过专注于预期误差，我们的方法允许条件错误率的变异性，这可以提高整体准确性或者减少平均区间大小。虽然我们考虑的问题是回归型的，但我们使用的损失是组合型的，这使我们能够提供 PAC 样式的有限样本保证。

Oct, 2017

在线主动回归

通过在线化算法实现积极回归问题的解决，利用较少的标签查询，实现收到的数据点的回归，提出新的算法解决问题。

Jul, 2022

无分布条件下的回归预测推断

本文提出了基于顺应性推断的无分布预测推断的一般框架，并通过分析和比较其两个主要变体：完整顺应性推断和分裂顺应性推断以及相关的 jackknife 法，作出了在统计准确度和计算效率之间的不同权衡。与此同时，本文还发展了一种构建有效样本内预测间隔的方法，称为 “排名为一” 的顺应性推断。本文提出的所有提案的实施都可以使用 R 包 “conformalInference” 进行。

Apr, 2016

基于回归神经网络的可靠预测区间

该论文采用一种名为 Conformal Prediction (CP) 的新型机器学习框架，基于独立同分布的数据，提出了一种扩展传统回归神经网络的方法，将点预测转化为满足所需置信水平的预测区间。作者在四个基准数据集和预测电离层连接中的重要参数之一 —— 总电子含量 (TEC) 的预测问题上进行了实证评估，结果表明该方法产生的预测区间在实践中既具有良好的校准性又足够紧凑。

Dec, 2023

专家建议下的连续预测

本文通过差分方程和随机微积分的连续时间分析视角，研究离散时间问题，提出了一个连续时间、无需参数算法，并开发了一个类似的离散算法，最后提出了一个任意时间的算法以应对最难情况，并给出了一些令人满意的实验证据。

Jun, 2022