自动化机器学习:最新技术和未解决的挑战
这篇综述旨在推广对自动化/自主机器学习系统的更广阔视角,并探讨整合各种机制和理论框架的最佳方式。主要介绍超参数优化、多组件模型、神经架构搜索、自动特征工程、元学习、多层集成、动态自适应、多目标评估、资源限制、灵活的用户参与和泛化原则的发展。最终得出结论,建立自动化机器学习系统的架构整合是一个值得更深入探讨的重要问题。
Dec, 2020
本文提出了一种名为SapientML的自动机器学习技术,通过从现有数据集中学习人类编写的管道,实现针对新数据集的高质量管道的快速生成,采用了一种三阶段程序合成方法来进行搜索空间的有效管理。评估结果表明,在41个基准数据集中,SapientML在27个基准数据集上的表现最佳或与最佳工具相当。
Feb, 2022
评估和比较了六种流行的自动机器学习框架在 100 个数据集上的性能,并考虑了时间预算、搜索空间大小、元学习和集成构建等因素对比较的影响,结果揭示了多种有趣的见解。
Apr, 2022
本文分析了自动机器学习在企业分析应用中的潜力,并将H2O AutoML框架与手工调整的ML模型在三个真实数据集上进行了基准测试,发现H2O AutoML框架快速、易用、可靠,表现接近手工调优的ML模型,是一个有价值的工具,能够支持快速原型设计,缩短开发和部署周期,并能够弥合ML专家供需之间的差距。
May, 2022
本文通过对 GitHub 上的开源项目进行调研,分析了当前机器学习从业者使用自动化机器学习工具的情况,研究结果表明AutoML工具已经广泛应用于机器学习的许多领域,可以极大的提高特征工程、模型训练和超参数优化的效率。
Aug, 2022
本文提出了一种名为Caml的元学习方法,可以自动适应其自身AutoML参数,以优化特定任务的高性能管道,并可以考虑用户定义的应用约束条件,以获得满足约束条件的高预测性能的管道。
Jun, 2023
自动化机器学习(AutoML)是一个研究领域,专注于开发自动生成机器学习模型的方法。本文提出了一个建立通用AutoML系统的参考框架,并通过对该领域主要方法的叙述性回顾,提炼了基本概念以支持其设计,并讨论了AutoML应用中的一些未解决问题,以供未来研究参考。
Aug, 2023