ABC：在大规模数据集上高效选择机器学习配置

AAAINov, 2018

ABC：在大规模数据集上高效选择机器学习配置

ABC: Efficient Selection of Machine Learning Configuration on Large Dataset

Silu Huang, Chi Wang, Bolin Ding, Surajit Chaudhuri

TL;DR研究了在给定一组配置和一个大的数据集随机划分为训练和测试集的情况下，如何在训练集上训练以获取近似最高测试精度的最佳配置，使用置信区间（CI）-based 渐进采样和剪枝策略，能够保证小的精度损失。与使用完整数据寻找精确最佳配置相比，我们的解决方案实现了超过两个数量级的速度提升，而返回的顶部配置具有相同或接近的测试准确性。

Abstract

A machine learning configuration refers to a combination of preprocessor, learner, and →

machine learning configuration preprocessor hyperparameters testing accuracy

发现论文，激发创造

算法配置中的注意事项与最佳实践

研究自动化算法配置的困境及解决方案，提出了避免实验设计问题和达到最新性能的最佳实践，并介绍了可处理多个问题的工具 GenericWrapper4AC。

May, 2017

发现多种算法配置

本文扩展了算法配置的自动化调节方法，使用后处理方法、多阶段方法和多臂赌博机的在线算法来实现自动检测配置数据集中的多个模式。在多个机器人应用领域中，如立体深度估计、可微分渲染、运动规划和视觉测速中，本文反映了这些方法的性能优势。

Mar, 2023

通过数学规划学习配置数学规划求解器

我们讨论寻找适合特定问题实例的数学规划求解器配置的问题，并提出了一个两阶段的解决方法。在第一阶段，我们学习了问题实例、配置以及规划求解器在给定实例上的性能之间的关系。学习一个好的求解器配置的一个特定困难是参数设置可能并不都是独立的；这需要施加硬约束，而许多广泛使用的监督学习方法不能本身实现。我们在我们方法的第二阶段处理这个问题，利用所学到的信息来构建和解决一个优化问题，该问题在配置参数设置上具有显式的依赖性 / 一致性约束的表示。我们讨论了在水力谷的短期计划中出现的两个不同实例上该方法的计算结果。我们使用逻辑回归作为监督学习方法，并考虑 CPLEX 作为感兴趣的求解器。

Jan, 2024

算法配置问题

算法优化领域已经通过自动配置算法参数的方法显著进展。本文深入研究了算法配置问题，重点优化针对特定决策 / 优化问题实例的参数化算法。我们提出了一个全面的框架，不仅形式化了算法配置问题，还概述了利用机器学习模型和启发式策略解决该问题的不同方法。本文将已有的方法论分为按实例和按问题的方法，并区分了模型构建和部署的离线和在线策略。通过综合这些方法，我们旨在为理解和应对算法配置中固有的复杂性提供清晰的路径。

Mar, 2024

深度配置性能学习：系统调查与分类

本文综述了深度学习在可配置软件性能学习方面的研究，包括配置数据的准备、深度配置性能学习模型的构建、模型的评估以及与软件配置相关的不同任务中的应用。同时，文章还总结了在调查中发现的良好实践和可能存在的问题，以及对该领域未来机会的见解。

Mar, 2024

自动算法配置方法综述

该论文介绍了关于算法配置问题的各种变体和方法，提出了用于描述算法配置问题和配置方法特征的分类法，并在此基础上回顾了已有的算法配置文献，提出了各种配置方法的设计选择，以及针对不同问题变体的对比方法，最终总结了行业中算法配置的现状并为未来研究提供了方向。

Feb, 2022

基于模型算法配置的热启动

提出一种基于预测模型的算法配置方法，利用算法在先前基准测试的性能信息来对新类型的基准测试进行热启动配置，实验证明相较于现有的算法配置方法，该方法在优化硬组合问题求解器时可大幅提升速度（最高可达 165 倍），同时可以在相同的计算预算下找到更好的配置。

Sep, 2017

机器学习算法超参数优化：理论与实践

本篇论文研究了常见机器学习模型的超参数优化，介绍了一些最先进的优化技术，并讨论了如何将它们应用于机器学习算法。同时，也提供了许多用于超参数优化问题的库和框架，并在基准数据集上进行了实验，以比较不同优化方法的性能，提供超参数优化的实际例子。该综述论文将帮助工业用户、数据分析师和研究人员通过有效地识别适当的超参数配置来更好地开发机器学习模型。

Jul, 2020

大数据集机器学习超参数的快速贝叶斯优化

提出了一种基于生成模型的贝叶斯优化方法，通过学习验证误差关于训练集大小的函数，并在小的子集上进行预先配置的探索，从而加速超参数优化，并且可以自动平衡全局最优解的信息增益与计算成本。实验结果表明，该方法比现有的另外两种贝叶斯优化方法和一种最近提出的 Hyperband 策略都要更快地找到高质量解。

May, 2016

机器学习中的模型评估、模型选择和算法选择

本文综述了机器学习中模型评估、模型选择和算法选择等三个子任务的不同技术，并讨论了每种技术的主要优缺点，给出了推荐实践建议。重点介绍了常见的模型评估和选择技术，如保留集方法和交叉验证技术，并给出了实用技巧。同时提出了多种算法比较策略，包括 5x2 交叉验证和嵌套交叉验证等，推荐在小数据集情况下使用。

Nov, 2018