快速分配实数回归

Nov, 2013

Fast Distribution To Real Regression

Junier B. Oliva, Willie Neiswanger, Barnabas Poczos, Jeff Schneider, Eric Xing

TL;DR本文研究了实值回归分布问题，提出了一种双基估计器，旨在缓解大数据问题，具有独立于实例数量的计算复杂度和一般映射的快速收敛率。

Abstract

We study the problem of distribution to real-value regression, where one aims to regress a mapping $f$ that takes in a distribution input

distribution regression kernel-kernel estimator double-basis estimator computation complexity

发现论文，激发创造

分布回归学习理论

本文研究了分布回归问题，提出了一种基于再生核希尔伯特空间的简单分析计算的岭回归方法，证明了该方法在两阶段抽样设置下是一致的，并且该估算器能够达到一阶段最小化最优速率。

Nov, 2014

分布的两阶段样本学习理论

该研究提出了一种简单有效的方法，将概率分布嵌入再应用岭回归算法来解决分布回归问题，同时证明该方法的稳定性和收敛速度，回答了 15 年来未解决的开放性问题，并涵盖了一系列相关的概率分布问题。

Feb, 2014

大维数情况下核回归的最优速率

对大维数据的核回归进行研究，利用 Mendelson 复杂度和度量熵的上界和下界来表征核回归的极小二乘误差率，进一步确定最优极小二乘误差率，并发现该曲线沿着参数变化时呈现多次下降行为和周期平台行为，同时也适用于神经切线核和宽神经网络。

Sep, 2023

在线回归竞争与再生核希尔伯特空间

研究了使用一种新的预测算法在无需假设标签与对象的生成方式的条件下，对已知标签对象的实时预测问题，通过比较此算法与一定范围内的预测规则，证明了此算法的误差率在极限范围下可达到最佳状态，可用于无参统计学的普适预测。

Nov, 2005

快速非参数条件密度估计

通过建立 full density 模型 f (yjx) 而非只有期望值 E (yjx)，条件密度估计广义了回归。本文提出了双核条件密度估计器，并引入了基于双数树的快速算法，用最大似然准则进行带宽选择，从而在处理多变量数据集时取得 380 万倍的加速。

Jun, 2012

基于现实假设的核回归泛化

对于几乎所有常见和现实设置，本论文旨在提供一种统一的理论来上界核回归的超额风险。通过提供适用于常见核函数和任意正则化、噪声、输入维度和样本数量的严格界限，并提供核矩阵特征值的相对扰动界限，揭示了核矩阵的特征值尾部分布形成一种隐式正则化现象，从而实现良好的泛化。本研究的结果适用于高输入维度的良性过拟合、固定维度的近似过拟合以及正则化回归的明确收敛速率。

Dec, 2023

无分布自由分布回归

本文介绍了分布式回归，在不假设误差项和协变量的分布的情况下，证明了当有效维度足够小时（由加倍维度测量），过度的预测风险会以多项式的方式收敛于零。

Feb, 2013

通过非参数散度估计在样本集上的核函数

该论文提出了一种基于核函数的机器学习算法，可以通过对数据集的分组进行处理，采用独立同分布的样本集作为数据点，利用非参数估计器提取核函数特征从而实现多种分类、回归和异常检测等任务。

Feb, 2012

贝叶斯回归的随机投影

该研究论文探讨随机投影作为贝叶斯回归分析的数据降维技术，证明了高维分布在数据点从 n 到 k 时仍可以得到保留，通过对投影数据进行高斯似然函数的评估获得的结果误差很小，结果表明该方法能够高效恢复回归模型。

Apr, 2015

鲁棒线性回归：多项式时间内的最优速率

本文提出了一种在数据为超收缩分布、存在不可避免的敌对噪声情况下，基于平方和框架的线性模型学习算法，该算法的收敛速度与扰动的比例成幂率关系，能达到理论最优收敛速度且在先前研究中未被发现。

Jun, 2020