算法配置中的注意事项与最佳实践
算法优化领域已经通过自动配置算法参数的方法显著进展。本文深入研究了算法配置问题,重点优化针对特定决策 / 优化问题实例的参数化算法。我们提出了一个全面的框架,不仅形式化了算法配置问题,还概述了利用机器学习模型和启发式策略解决该问题的不同方法。本文将已有的方法论分为按实例和按问题的方法,并区分了模型构建和部署的离线和在线策略。通过综合这些方法,我们旨在为理解和应对算法配置中固有的复杂性提供清晰的路径。
Mar, 2024
提出一种基于预测模型的算法配置方法,利用算法在先前基准测试的性能信息来对新类型的基准测试进行热启动配置,实验证明相较于现有的算法配置方法,该方法在优化硬组合问题求解器时可大幅提升速度(最高可达 165 倍),同时可以在相同的计算预算下找到更好的配置。
Sep, 2017
本文探讨了自动算法配置 (AAC) 中的性能估计问题,首先证明了在实际设置中的通用最佳性能估计器,然后分别考虑了有限和无限配置空间,建立了估计误差的理论界限,并在四个涉及不同问题领域的算法配置情景中进行了广泛的实验验证。此外,本文还提出了加强现有 AAC 方法的见解。
Nov, 2019
该论文介绍了关于算法配置问题的各种变体和方法,提出了用于描述算法配置问题和配置方法特征的分类法,并在此基础上回顾了已有的算法配置文献,提出了各种配置方法的设计选择,以及针对不同问题变体的对比方法,最终总结了行业中算法配置的现状并为未来研究提供了方向。
Feb, 2022
本文描述了一种自动化算法配置框架,其中提供了用于通过变化一组序数和 / 或分类参数来优化目标算法在给定问题实例类上的性能的方法,并提供了用于加速本地搜索的算法配置过程的新技术,同时通过对 SAT 的完整和不完整算法进行配置,评估了我们方法的结果,同时还提供了关于自动配置 CPLEX 混合整数规划求解器的首个已知结果。
Jan, 2014
本文扩展了算法配置的自动化调节方法,使用后处理方法、多阶段方法和多臂赌博机的在线算法来实现自动检测配置数据集中的多个模式。在多个机器人应用领域中,如立体深度估计、可微分渲染、运动规划和视觉测速中,本文反映了这些方法的性能优势。
Mar, 2023
研究了在给定一组配置和一个大的数据集随机划分为训练和测试集的情况下,如何在训练集上训练以获取近似最高测试精度的最佳配置,使用置信区间(CI)-based 渐进采样和剪枝策略,能够保证小的精度损失。与使用完整数据寻找精确最佳配置相比,我们的解决方案实现了超过两个数量级的速度提升,而返回的顶部配置具有相同或接近的测试准确性。
Nov, 2018
本篇论文研究了常见机器学习模型的超参数优化,介绍了一些最先进的优化技术,并讨论了如何将它们应用于机器学习算法。同时,也提供了许多用于超参数优化问题的库和框架,并在基准数据集上进行了实验,以比较不同优化方法的性能,提供超参数优化的实际例子。该综述论文将帮助工业用户、数据分析师和研究人员通过有效地识别适当的超参数配置来更好地开发机器学习模型。
Jul, 2020
大多数优化算法都具有与算法相关的参数,其参数值的设置可以在很大程度上影响所考虑算法的行为。因此,应进行适当的参数调优,以确保用于优化的算法能够表现良好,并且能够足够强大地解决不同类型的优化问题。本文回顾了一些参数调优的主要方法,然后强调了关于参数调优最新进展的重要问题。同时还讨论了一些开放问题,并提出了一些建议,供将来的研究参考。
Aug, 2023