线性采样稀疏化主动回归
我们提出了一种新的主动学习算法,针对参数化线性回归。我们提供了在一般分布下错配模型的有限样本收敛保证。我们的主动学习者可证明能够改善被动学习者。我们的主动学习者通过分层技术接近最优风险,使用分段常量逼近实现最优风险对于分布的先前知识来实现。
Oct, 2014
提出一种多项式算法,其中通过删除数据点和减少步骤,可以实现与最优解的期望 $(1+d/n)$ 接近度,从而达到在减少标签复杂度的情况下,实现紧密近似。
May, 2023
本文研究高维统计中的稀疏线性回归问题,特别关注相关随机设计条件下的 Lasso 算法以及基于特征适应的算法,提供了可以自适应处理少量近似相关性的 Lasso 算法优化及多项式复杂度的改进,以实现在常数稀疏度和任意协方差 Σ 情况下的最优样本复杂度。
May, 2023
该研究考虑在线主动学习来收集回归建模的数据,提出了一种基于阈值的算法来选择最具信息量的观测数据,并将其推广到高维稀疏线性回归,仿真结果表明该算法相对于被动随机抽样具有显著优势。
Feb, 2016
针对模型类如何拟合标记数据的问题,我们提出了一种计算学习能力的方法,可以使用较小的数据量得出精确结果。该方法也适用于二元分类问题,并在多种真实和合成数据集上得到了验证。
May, 2018
考虑了只观察到少量标签时,寻找 l1 回归的近似解的问题。我们表明,根据其 Lewis 权重对 X 进行采样并输出经验最小化器可在概率 1-δ 下成功地进行,其中 m>O(1/ε²dlog (d/εδ))。我们还给出了相应的下界。
May, 2021
对单指数模型进行主动学习方法的研究,证明了在已知或未知函数情况下,通过统计杠杆得分采样,采集约 O (d) 个样本即可学习出接近最优的单指数模型,且适用于拟合偏微分方程等科学机器学习应用。这种方法无需对数据分布进行假设,在挑战性的对手学习环境中表现出鲁棒性。
May, 2024
该文针对主动覆盖问题,借助支持向量估计器等算法在无标签数据集上提出了在少量标签查询即可完成标记所有阳性样本的主动学习方法,并证明该方法在图像数据集等基准测试中取得了相对优于离线方法和基线算法的效果。
Jun, 2021