- 基于无导数优化的紧凑模型参数提取
通过无导数优化来解决紧凑模型参数提取的问题,在设备建模中展示无导数优化的实际效益,并成功地对两个半导体器件进行了建模。
- 复杂系统的无导数树优化
这篇研究论文提出了一种基于树搜索的无导数优化方法,借助机器学习模型逐步逼近全局最优解,有效解决高维复杂系统的优化问题,在各种基准函数上实现了高达 2000 维的全局最优收敛,比已有方法快 10 到 20 倍,具有广泛的应用性,可用于材料、物 - 大规模语言模型低秩适应的无导数优化
在少样本情境中,本研究通过将低秩模块添加到模型的自注意力层中,并采用两种无导数优化方法来交叉优化这些低秩模块,展示出与现有的基于梯度的参数高效调整和无导数优化方法相比,在多个任务和语言模型上取得了显著改进,并在内存使用和收敛速度方面表现出明 - 增强优化性能:高斯融合搜索与 Powell 方法的无导数优化中的新型混合算法
通过将高斯压缩搜索(GCS)与不需求导的优化中的 Powell 方法进行混合,本研究提出了一种增强优化性能的新方法。通过实验发现,将 GCS 与某些传统的不需求导的优化方法相结合,不仅可以显著提升性能,同时保留了每种方法的优势,为优化复杂系 - 当梯度下降与无导数优化相遇:黑盒场景中的完美匹配
本文介绍了一种融合梯度下降和无导数优化的全新方法 GDFO,并使用知识蒸馏的方式成功地将梯度下降引入黑盒调整中以优化任务特定的连续提示。实验结果表明,GDFO 可以取得显著的性能提升。
- 元启发式算法是否值得使用?关于黑盒优化问题,自然启发式和确定性技术之间的计算比较
本文对无导数优化的确定性技术和基于自然启发的技术进行了计算比较,并通过对五个基准测试集的结果分析表明,在目标函数评估相对较便宜的情况下,基于自然启发的方法比确定性方法具有更好的性能,然而,在目标函数评估昂贵或被禁止的情况下,确定性方法可能提 - ICLR学习指导随机搜索
研究无导数优化高维函数的方法,提出一种基于在线学习的方法,同时学习流形和优化函数,能够显著降低样本复杂性,经过实验证明有效性高于其他无导数优化算法。
- 一种更高效的黑盒对抗攻击方法:平铺和进化策略
介绍一种新的黑盒攻击方法,它使用一种新的目标函数并扩展了以前的黑盒对抗攻击方法,证明深度神经网络不具有单次平铺攻击的鲁棒性,并在预算限制下(对抗攻击成功率能达到 99.2%),在有限的预算下(对抗攻击成功率能达到 100%),比当前最先进的 - 一种具有动量的随机无导数优化方法
本文提出了一种基于随机零阶方法和动量的 SMTP 方法进行无约束最小化的函数优化,该方法在非凸优化、凸优化和强凸优化方程中具有新的复杂度结果,并在数值实验中测试了此方法与其它最新无导数优化算法的性能比较。
- 一种基于重要性采样的随机无导数优化方法:理论与学习控制
本文提出了首个具有重要性采样的导数无关优化方法,并针对非凸、凸和强凸函数推导出新的改进的复杂性结果。作者进行了大量实验,证实该算法在高维连续控制问题中具有实用性。
- 通过方差减少方法的随机零阶优化
本文提出一种基于随机零阶梯度与方差降低的高斯平滑的新型方法,用于优化非凸函数,特别是深度神经网络的黑盒攻击问题,并在实验中证明了其比现有的导数 - free 优化技术表现更优。
- KDDAutotune: 一种无导数优化框架,用于超参数调优
该论文提出了一种自动化的并行无导数优化框架 ——Autotune,它结合了多种专业的采样和搜索方法,可有效地调整机器学习模型的超参数,从而提高模型质量和训练效率,并通过并行计算和分布式训练优化算法的资源性能。
- 结构化演化与紧凑体系结构的可扩展策略优化
采用结构化随机正交矩阵的梯度逼近黑盒优化方法可以学习到比标准梯度估算技术更好的紧凑策略,从而提高了在资源有限的实际硬件上的速度和可伸缩性。
- 基于核的赌博式凸优化方法
提出一种新的算法解决在无导数情况下的 $adversarial convex bandit$ 问题,其包含了核方法、伯努利卷积的一般化和新的退火时间表。这个算法在要求多次迭代的场景中可以取得佳效果。
- 使用 CMA-ES 算法对深度神经网络的超参数进行优化
本文提出使用 CMA-ES 算法作为深度神经网络超参数优化的一种可行的选择,通过一个 MNIST 数据集的卷积神经网络的 toy experiment,对比了 CMA-ES 和 Bayesian 优化算法在 30 个 GPU 并行计算下的效 - 变分混合量子 - 经典算法理论
本文讨论了量子算法中的优化问题,并提出了一种基于量子 - 经典混合的优化方案,其中包括变分绝热量子算法和单粒子门晶格,通过拟合和消除误差和采用现代没有导数的优化技术来节省计算成本。