线性采样稀疏化主动回归

Nov, 2017

Active Regression via Linear-Sample Sparsification

Xue Chen, Eric Price

TL;DR本研究提出了一种方法，通过减小样本复杂度，提高了各种曲线拟合问题包括线性回归、多项式回归和连续稀疏傅里叶变换的活性学习中的解的精度。

Abstract

We present an approach that improves the sample complexity for a variety of curve fitting problems, including active learning for

发现论文，激发创造

通过在线化算法实现积极回归问题的解决，利用较少的标签查询，实现收到的数据点的回归，提出新的算法解决问题。

Jul, 2022

我们提出了一种新的主动学习算法，针对参数化线性回归。我们提供了在一般分布下错配模型的有限样本收敛保证。我们的主动学习者可证明能够改善被动学习者。我们的主动学习者通过分层技术接近最优风险，使用分段常量逼近实现最优风险对于分布的先前知识来实现。

Oct, 2014

提出一种多项式算法，其中通过删除数据点和减少步骤，可以实现与最优解的期望 $(1+d/n)$ 接近度，从而达到在减少标签复杂度的情况下，实现紧密近似。

May, 2023

本文研究高维统计中的稀疏线性回归问题，特别关注相关随机设计条件下的 Lasso 算法以及基于特征适应的算法，提供了可以自适应处理少量近似相关性的 Lasso 算法优化及多项式复杂度的改进，以实现在常数稀疏度和任意协方差 Σ 情况下的最优样本复杂度。

May, 2023

研究了高维线性回归在对抗性污染下的稳健模型问题，并针对从高斯分布生成的未被修正的样本的基本情况给出了几乎最紧的上界和计算下界。

May, 2018

该研究考虑在线主动学习来收集回归建模的数据，提出了一种基于阈值的算法来选择最具信息量的观测数据，并将其推广到高维稀疏线性回归，仿真结果表明该算法相对于被动随机抽样具有显著优势。

Feb, 2016

针对模型类如何拟合标记数据的问题，我们提出了一种计算学习能力的方法，可以使用较小的数据量得出精确结果。该方法也适用于二元分类问题，并在多种真实和合成数据集上得到了验证。

May, 2018

考虑了只观察到少量标签时，寻找 l1 回归的近似解的问题。我们表明，根据其 Lewis 权重对 X 进行采样并输出经验最小化器可在概率 1-δ 下成功地进行，其中 m>O（1/ε²dlog (d/εδ)）。我们还给出了相应的下界。

May, 2021

对单指数模型进行主动学习方法的研究，证明了在已知或未知函数情况下，通过统计杠杆得分采样，采集约 O (d) 个样本即可学习出接近最优的单指数模型，且适用于拟合偏微分方程等科学机器学习应用。这种方法无需对数据分布进行假设，在挑战性的对手学习环境中表现出鲁棒性。

May, 2024

该文针对主动覆盖问题，借助支持向量估计器等算法在无标签数据集上提出了在少量标签查询即可完成标记所有阳性样本的主动学习方法，并证明该方法在图像数据集等基准测试中取得了相对优于离线方法和基线算法的效果。

Jun, 2021