- 分类任务中的病理化正则化方案
该研究论文通过展示训练模型获得的分类分数与数据集之间的趋势逆转的可能性,阐述了模型训练中正则化参数的选择对趋势逆转发生的影响,提供数据科学从业者避免遭受趋势逆转的超参数选择的实用工具,并通过逻辑回归在病态正则化区间上的数值结果,从路径性数据 - 基于群体的 SLOPE 模型的强筛选规则
调整惩罚回归模型中的正则化参数是一项昂贵的任务,需要逐个拟合多个参数。强筛选规则通过降低输入的维度大大减少了计算成本。我们对基于分组的有序 L1 惩罚估计(SLOPE)模型进行了强筛选规则的开发,适用于更广泛的基于分组的 OWL 模型,包括 - 使用非线性协方差矩阵估计器的正则化线性判别分析
利用正半定岭估计器及非线性协方差矩阵估计器,本文提出了一种新颖的 NL-RLDA 分类器,并通过综合性能评估表明其在合成数据和真实数据上的有效性。与现有方法相比,该技术在多个数据集上均表现优异。
- 收敛的即插即用方法:近端去噪器和无约束正则化参数
本文提出了两种解决方法,一是无需对正则化参数做限制的新型 PnP-DRS 收敛证明,二是在更广范围的正则化参数下收敛的 PGD 算法的放松版本,实验证明这两种解决方案均提高了图像恢复的准确性。
- 核岭回归在幂律衰减下的渐近学习曲线
在这篇论文中,我们在温和且更现实的假设下,对学习曲线进行了全面的描述,详细阐述了正则化参数、源条件和噪声的选择对学习曲线的影响和相互作用。特别地,我们的结果表明,在噪声水平较小时,' 良性过拟合现象 ' 只存在于非常宽的神经网络中。
- 熵优化传输的最小内在维度缩放
本文针对数据的低固有维度这一流形假设,提出了一种基于内在维度的统计精细界限的方法,证明了最小固有维度缩放现象是一种普遍现象,为熵正则化的统计效应提供了首个严格解释。
- 通过双层学习寻找最优正则化参数
利用变分正则化方法求解线性反问题时,采用超参数调节正则化项,通过强化先验信息来提高求解结果,核心问题在于如何选择一个合适的正则化参数。本文提出了一个新的条件来更好地描述正则化参数的正性,并验证和探索了这个新条件,同时也探究了这个新条件在小和 - 基于分离度和离散度比率的高效支持向量机正则化参数、核函数以及核函数参数选择
通过随机分析正则化参数的行为,本文将 SVM 的性能建模为数据的可分性和散乱性比率的函数。该比率可以自动检测线性或非线性可分性,并提供优化的正则化参数和核函数及其参数,从而将 CV 网格搜索的计算复杂性仅减少到一次使用 SVM,真实数据集的 - 图信号的最优恢复
从优化恢复的角度考虑了图信号处理中部分观测数据的平滑处理问题,并提出了一种计算最优或接近最优正则化参数的方法,在半合成图信号处理数据集的数值实验中取得了良好效果。
- 高维岭回归经验风险最小化的基本限制
本文首次表征凸形 ERM 在高维广义线性模型推断中的基本统计精度界限,推导出任意损失函数和正则化参数值的紧凑下界,并精确评价了损失函数和正则化参数值的优化调整。
- ICLR岭回归:结构、交叉验证和草图
本文研究岭回归的三个基本问题:估计器结构、正确使用交叉验证选择正则化参数以及如何在不损失过多精度的情况下加速计算。我们在一个统一的大数据线性模型下考虑了这三个问题。通过将岭回归精确表示为真实参数和噪声的协方差矩阵相关的线性组合,我们研究了 - 基于反投影的保真度项用于病态线性反问题
本文研究了在图像处理领域中经常出现的良态线性反问题,重点关注不同的保真度项,发现一个新项可以优于最小二乘法,并对各种先验进行了理论和实验研究,提出一种 “迭代去噪和反向投影” 框架。
- ICML高维快速参数调整的近似留一法
本文提出了两种框架来解决高维情境下通过加入惩罚项来降低过拟合的问题,同时证明了二者在光滑条件下的等效性,并在多个标准问题中验证了该方法的有效性。
- LASSO 和近似消息传递的一致参数估计
此篇论文研究了使用最小绝对收缩和选择算子(LASSO)和近似消息传递(AMP)算法解决包含噪声和随机线性观测的问题,并回答了该问题中关于正则化参数和阈值参数的基本问题,帮助找到最优的参数调整方法。
- 一种可靠且高效的 Lasso 调参方案与优化保障算法
介绍了一种新颖的方案,用于在具有 Lasso 的高维线性回归中选择正则化参数,该方案受非参数回归中带宽选择的 Lepski 方法的启发,具有最佳的有限样本保证和快速算法。
- 一般设计矩阵下 Lasso 的自由度
本文研究了线性回归模型的惩罚 L1 最小化(也称为 Lasso)的自由度(DOF),给出了 Lasso 响应的 DOF 的闭合形式表达式,证明了在任何给定的 Lasso 正则化参数 λ 和任何观测数据 y 属于完整集(勒贝格)测度的情况下,