自动化机器学习：最新技术和未解决的挑战

Jun, 2019

自动化机器学习：最新技术和未解决的挑战

Automated Machine Learning: State-of-The-Art and Open Challenges

Radwa Elshawi, Mohamed Maher, Sherif Sakr

TL;DR本文研究机器学习中的自动化算法选择与超参数调整问题，以及AutoML流程的其他步骤，总结现有技术与工具，探讨未来研究方向和挑战。

Abstract

With the continuous and vast increase in the amount of data in our digital world, it has been acknowledged that the number of knowledgeable data scientists can not scale to address these challenges. Thus, there was a crucial need for automating the process of building good

发现论文，激发创造

自动机器学习框架的基准测试

本研究比较了多种 AutoML 工具在开源数据集上的表现，发现 auto-sklearn 在分类数据集上表现最佳，而 TPOT 在回归数据集上表现最佳。

Aug, 2018

将人类从学习应用中剔除：自动化机器学习综述

本文介绍了AutoML问题的定义和解决方案，项目分类和现有工作的审查，并提出了一个AutoML框架以减少对人类专家的需求和提高学习性能。

Oct, 2018

自动机器学习：AutoML 方法和工具的评估和比较

本文介绍了自动化机器学习技术（AutoML）的研究现状，重点评估了多种AutoML工具在不同数据集、不同数据段上的表现和优缺点。

Aug, 2019

自动机器学习的综合框架

这篇综述旨在推广对自动化/自主机器学习系统的更广阔视角，并探讨整合各种机制和理论框架的最佳方式。主要介绍超参数优化、多组件模型、神经架构搜索、自动特征工程、元学习、多层集成、动态自适应、多目标评估、资源限制、灵活的用户参与和泛化原则的发展。最终得出结论，建立自动化机器学习系统的架构整合是一个值得更深入探讨的重要问题。

Dec, 2020

SapientML: 通过从人类编写的解决方案中学习来综合机器学习流水线

本文提出了一种名为SapientML的自动机器学习技术，通过从现有数据集中学习人类编写的管道，实现针对新数据集的高质量管道的快速生成，采用了一种三阶段程序合成方法来进行搜索空间的有效管理。评估结果表明，在41个基准数据集中，SapientML在27个基准数据集上的表现最佳或与最佳工具相当。

Feb, 2022

AutoMLBench: 自动化机器学习框架的全面实验评估

评估和比较了六种流行的自动机器学习框架在 100 个数据集上的性能，并考虑了时间预算、搜索空间大小、元学习和集成构建等因素对比较的影响，结果揭示了多种有趣的见解。

Apr, 2022

自动化机器学习：业务分析中的 AI 决策

本文分析了自动机器学习在企业分析应用中的潜力，并将H2O AutoML框架与手工调整的ML模型在三个真实数据集上进行了基准测试，发现H2O AutoML框架快速、易用、可靠，表现接近手工调优的ML模型，是一个有价值的工具，能够支持快速原型设计，缩短开发和部署周期，并能够弥合ML专家供需之间的差距。

May, 2022

自动机器学习工具使用的实证研究

本文通过对 GitHub 上的开源项目进行调研，分析了当前机器学习从业者使用自动化机器学习工具的情况，研究结果表明AutoML工具已经广泛应用于机器学习的许多领域，可以极大的提高特征工程、模型训练和超参数优化的效率。

Aug, 2022

局限严重应用中的自动机器学习

本文提出了一种名为Caml的元学习方法，可以自动适应其自身AutoML参数，以优化特定任务的高性能管道，并可以考虑用户定义的应用约束条件，以获得满足约束条件的高预测性能的管道。

Jun, 2023

实践中自动化机器学习的通用配方

自动化机器学习（AutoML）是一个研究领域，专注于开发自动生成机器学习模型的方法。本文提出了一个建立通用AutoML系统的参考框架，并通过对该领域主要方法的叙述性回顾，提炼了基本概念以支持其设计，并讨论了AutoML应用中的一些未解决问题，以供未来研究参考。

Aug, 2023