通过可扩展的搜索空间分解实现高效的端到端自动机器学习

Jun, 2022

通过可扩展的搜索空间分解实现高效的端到端自动机器学习

Efficient End-to-End AutoML via Scalable Search Space Decomposition

Yang Li, Yu Shen, Wentao Zhang, Ce Zhang, Bin Cui

TL;DRVolcanoML 是一个可扩展的 AutoML 框架，通过将大型搜索空间分解为较小的空间单元，提高了搜索空间分解的表达能力并找到比 auto-sklearn 更高效的分解策略。

Abstract

End-to-end automl has attracted intensive interests from both academia and industry which automatically searches for ML pipelines in a space induced by feature engineering, algorithm/model selection, and hyper-parameter tuning. Existing →

automl volcanoml search space scalability decomposition

发现论文，激发创造

将超参数搜索集成到 GramML 中

提出了 GramML 的扩展方法，支持更大的搜索空间，包括超参数搜索，通过 OpenML 基准测试发现与其他最新技术相比有显著的改进。

Apr, 2024

基于矩阵和张量分解的高效自动机器学习流水线搜索

本文提出了一种新的 AutoML 系统，利用矩阵和张量分解作为代理模型，通过贪心实验设计协议来高效收集有关新数据集的信息，从而解决数据科学家在选择适当的监督式学习模型时面临的挑战。经过对大型实际分类问题的实验，证明了这种方法的有效性。

Jun, 2020

蒙特卡罗树搜索与自动化机器学习

在 AutoML 任务中，使用基于蒙特卡罗树搜索（MCTS）的方法 Mosaic 来处理混合结构和参数昂贵的黑盒优化问题，并在基准测试中获得了统计显著的性能提升。

Jun, 2019

基于 ADMM 的 AutoML 管道配置框架

提出了一种基于 ADMM 的 AutoML 框架，可以将优化问题分解为易于处理的子问题，并整合黑箱约束以及优化目标函数。在 UCI ML 和 OpenML 数据集上的实验表明，相比其他的 AutoML 方法，该框架具有更大的灵活性、更高的效果和独特的能力。

May, 2019

SapientML: 通过从人类编写的解决方案中学习来综合机器学习流水线

本文提出了一种名为 SapientML 的自动机器学习技术，通过从现有数据集中学习人类编写的管道，实现针对新数据集的高质量管道的快速生成，采用了一种三阶段程序合成方法来进行搜索空间的有效管理。评估结果表明，在 41 个基准数据集中，SapientML 在 27 个基准数据集上的表现最佳或与最佳工具相当。

Feb, 2022

DeepArchitect: 自动设计和训练深层体系结构

本文提出一种可自动设计、训练深度神经网络的框架，通过自动配置架构和超参数进行模型搜索，实现了对复杂搜索空间的高效探索，并展示了随机搜索、蒙特卡罗树搜索和顺序模型优化等多种模型搜索算法在 CIFAR-10 数据集上的比较试验结果。

Apr, 2017

局限严重应用中的自动机器学习

本文提出了一种名为 Caml 的元学习方法，可以自动适应其自身 AutoML 参数，以优化特定任务的高性能管道，并可以考虑用户定义的应用约束条件，以获得满足约束条件的高预测性能的管道。

Jun, 2023

AutoMMLab：自然语言指令生成计算机视觉任务的可部署模型

AutoMMLab 是一个通用的、基于 LLM（语言模型）驱动的 AutoML 系统，通过用户友好的语言界面，自动化计算机视觉任务的整个模型生产流程，并利用 LLM 作为桥梁连接 AutoML 和 OpenMMLab 社区，使非专家个体能够轻松构建特定任务的模型。

Feb, 2024

DREAM: 自动机器学习流程的调试和修复

深度学习模型已成为现代软件系统中的一个整合组件。研究人员提出了自动化机器学习（AutoML）系统以应对模型设计的挑战，并发现现有的 AutoML 系统存在两个常见和严重的 bug：性能 bug 和无效的搜索 bug。为了解决这些问题，他们设计实现了 DREAM，一个用于自动修复 AutoML 系统 bug 的自动化调试和修复系统。实验结果表明 DREAM 能够有效高效地修复 AutoML 的 bug。

Dec, 2023

自动分量提升：可解释性自动机器学习系统

提出了一种 AutoML 系统，其构建了可解释的加法模型，使用高度可扩展的分量提升算法进行拟合，提供了易于模型解释的工具，并且在预测性能上与其他基于 AutoML 比较系统相媲美，更易于使用和透明。

Sep, 2021