- 复杂分形可训练性边界可由微不可见的非凸性产生
通过研究梯度下降中的学习率与损失函数之间的关系,我们发现简单的非凸扰动可以导致分形可训练性边界,这一发现有助于更好地理解神经网络训练过程中的复杂行为,从而提高训练策略的一致性和可预测性。
- 基于原始 - 对偶辅助罚函数的耦合约束双层优化方法
我们的论文研究了具有耦合约束的双层优化问题,并开发了一种名为 BLOCC 的(完全)一阶算法,实现对这一具有挑战性但较少被探索的场景的解决。我们为所提算法建立了严格的收敛理论,并通过使用塞维利亚城市的真实数据,对 SVM 中的超参数选择和交 - 量子神经网络的超参数优化
通过比较不同配置,我们对量子机器学习模型的性能进行了研究,提供了性能数据和超参数选择的具体建议。
- 连续学习场景下的自适应超参数优化
通过基于方差的函数分析技术,在持续任务学习中探索了超参数选择的作用以及根据任务复杂度不断自动调整超参数的必要性,实证表明该方法可以持续地加快超参数优化速度并在不断变化的顺序任务中表现出鲁棒性,为现实应用中更高效、更稳健、更适应性强的持续学习 - 通过表征编辑提高微调中的参数效率
Parameter Efficient Fine-Tuning (PEFT) 方法和 Representation EDiting (RED) 方法是解决神经模型微调中的可调超参数选择和可训练参数数量减少的关键研究领域和主题,通过对多种模型 - 高斯图模型结构学习中交叉验证的不一致性
通过理论分析和实证研究,我们揭示了交叉验证在高斯图模型中泛化有限,并通过与其他常用信息准则进行对比,揭示了这种不一致性。这对于需要超参数选择的图模型结构学习算法来说具有重要意义。
- 低密度分离假设下监督学习和无监督学习之间的随机矩阵分析
我们提出了一个理论框架,用于分析高维情况下基于低密度分离假设的半监督分类。我们介绍了 QLDS,一个线性分类模型,其中低密度分离假设通过二次边界最大化来实现。该算法具有显式解和丰富的理论性质,我们证明了我们算法的特殊情况是有监督情况下的最小 - LafitE: 带有特征编辑的潜在扩散模型用于无监督多类异常检测
在灵活的制造系统中,提出了一种无监督的多类异常检测方法,其中包括使用隐式扩散模型来重构数据,使用特征编辑策略来避免 “身份捷径” 问题,以及综合异常数据为虚假验证集来解决超参数选择问题。
- 基于莫罗包络的弱凸差分重构和双层规划算法
该研究设计了一种利用凸差算法基于价值函数法的重要双层规划算法, 以解决与超参数选择相关的应用问题,提出了在满足弱凸度假设的情况下根据下层问题 Moreau envelope 的差分弱凸规划改进措施,并验证了其有效性。
- 高效稳健的贝叶斯超参数选择方法在降维可视化中的应用
本研究提出了一个有效且强健的自动调参框架,用于在大型数据集和任意性能指标下进行降维算法的超参数选择,利用贝叶斯优化和代理模型,该方法使得超参数选择具有多目标权衡的效率,并允许我们进行数据驱动的敏感性分析。通过添加归一化和子采样,该框架表现出 - 黑盒 VI 的样本平均逼近
我们提出了一种黑盒变分推断的新方法,通过使用序列样本平均逼近问题来解决随机梯度上升选择步长的困难,我们使用拟牛顿方法和线搜索来解决确定性优化问题,并提出了一种启发式策略来自动选择超参数,实验表明我们的方法简化了变分推断问题,并实现了比现有方 - 图信号的最优恢复
从优化恢复的角度考虑了图信号处理中部分观测数据的平滑处理问题,并提出了一种计算最优或接近最优正则化参数的方法,在半合成图信号处理数据集的数值实验中取得了良好效果。
- ICLRDAVA: 逆敌对变分自编码器解耦
介绍了一种名为 DAVA 的新型变分自编码器训练程序,该程序完全消除了超参数选择问题,发现了一种名为 PIPE 的无监督分离的必要条件,并证明了 PIPE 可以积极预测抽象推理中下游模型的性能。
- ICLR基于采样的大型线性模型推断,应用于线性化拉普拉斯
引入可扩展的基于样本的 Bayesian 推断方法、匹配的超参数选择方法和经典特征归一化方法,以解决线性化神经网络推断中的计算成本限制和先前突出的路径学问题,从而在 CIFAR100、Imagenet 和高分辨率层析成像重建任务中实现线性化 - 通过排名评估预训练的自监督表示在下游任务中的表现
本研究提出了一种简单的无监督准则 RankMe 用于衡量 JE-SSL 表示学习的有效性,具备不需要标签,简单且无需调参等好处,可以在不依赖标签的情况下评估性能并选择最优调参方案。
- AAAI拟合 Q 评估的超参数选择方法及误差保证
该研究针对 FQE 算法的超参数调优问题,提出了一种基于近似超参数选择框架的优化方法,该方法不需要超参数就可以定义一种量化且可解释的最优化标准,并验证理论误差界与实际观察的匹配。
- 共同激活 共同连接:一种带自监督掩码预测的动态剪枝方法
本研究提出了一种基于 Hebbian 理论的动态网络剪枝方法,通过训练一个自我监督的二分类模型来预测每个层中需要处理的卷积核,从而实现 FLOPs 的减少,同时避免通过规范化引入复杂度来平衡各种损失,并实现透明的超参数选择。该方法在 CIF - 正类数据偏斜置信度的二元分类
该论文介绍了一种基于正例数据并配备置信度的弱监督学习方法,提出了一种带有参数的方法来消除偏斜置信度的负面影响,并提出了一种基于误分类率的方法选择超参数。实验结果表明该方法在线性模型和神经网络模型中均表现良好,并可行于驾驶员昏昏欲睡预测的实际 - 高斯过程和贝叶斯优化在金融应用中的作用
本文探讨了高斯过程和贝叶斯优化这两种方法在金融建模中的应用,特别是在利率期限结构建模和趋势跟踪策略中的运用。
- 无监督句子表示作为词语信息系列:重访 TF-IDF
本文提出了一种利用加权词向量嵌入学习无标注句子表示的无监督方法,通过 TF-IDF 变换提供的 Shannon 词熵拟合词向量的权重,选择不同的超参得出短期训练、在线推理的句子表示,经过与 STS 系统的对比表明,该方法在语义文本相似度模型