通过可扩展的搜索空间分解实现高效的端到端自动机器学习
本文提出了一种新的 AutoML 系统,利用矩阵和张量分解作为代理模型,通过贪心实验设计协议来高效收集有关新数据集的信息,从而解决数据科学家在选择适当的监督式学习模型时面临的挑战。经过对大型实际分类问题的实验,证明了这种方法的有效性。
Jun, 2020
在 AutoML 任务中,使用基于蒙特卡罗树搜索(MCTS)的方法 Mosaic 来处理混合结构和参数昂贵的黑盒优化问题,并在基准测试中获得了统计显著的性能提升。
Jun, 2019
提出了一种基于 ADMM 的 AutoML 框架,可以将优化问题分解为易于处理的子问题,并整合黑箱约束以及优化目标函数。在 UCI ML 和 OpenML 数据集上的实验表明,相比其他的 AutoML 方法,该框架具有更大的灵活性、更高的效果和独特的能力。
May, 2019
本文提出了一种名为 SapientML 的自动机器学习技术,通过从现有数据集中学习人类编写的管道,实现针对新数据集的高质量管道的快速生成,采用了一种三阶段程序合成方法来进行搜索空间的有效管理。评估结果表明,在 41 个基准数据集中,SapientML 在 27 个基准数据集上的表现最佳或与最佳工具相当。
Feb, 2022
本文提出一种可自动设计、训练深度神经网络的框架,通过自动配置架构和超参数进行模型搜索,实现了对复杂搜索空间的高效探索,并展示了随机搜索、蒙特卡罗树搜索和顺序模型优化等多种模型搜索算法在 CIFAR-10 数据集上的比较试验结果。
Apr, 2017
本文提出了一种名为 Caml 的元学习方法,可以自动适应其自身 AutoML 参数,以优化特定任务的高性能管道,并可以考虑用户定义的应用约束条件,以获得满足约束条件的高预测性能的管道。
Jun, 2023
AutoMMLab 是一个通用的、基于 LLM(语言模型)驱动的 AutoML 系统,通过用户友好的语言界面,自动化计算机视觉任务的整个模型生产流程,并利用 LLM 作为桥梁连接 AutoML 和 OpenMMLab 社区,使非专家个体能够轻松构建特定任务的模型。
Feb, 2024
深度学习模型已成为现代软件系统中的一个整合组件。研究人员提出了自动化机器学习(AutoML)系统以应对模型设计的挑战,并发现现有的 AutoML 系统存在两个常见和严重的 bug:性能 bug 和无效的搜索 bug。为了解决这些问题,他们设计实现了 DREAM,一个用于自动修复 AutoML 系统 bug 的自动化调试和修复系统。实验结果表明 DREAM 能够有效高效地修复 AutoML 的 bug。
Dec, 2023
提出了一种 AutoML 系统,其构建了可解释的加法模型,使用高度可扩展的分量提升算法进行拟合,提供了易于模型解释的工具,并且在预测性能上与其他基于 AutoML 比较系统相媲美,更易于使用和透明。
Sep, 2021