eTOP: 用于 AutoML 系统快速训练的管道提前终止技术
本研究介绍了一种改进版的自动机器学习工具 Layered TPOT,它采用了修改过的进化算法来根据适应度对候选 pipeline 进行评估,并在不同样本大小的 pipeline 之间提供分离的比较,从而在更短的时间内获得与 TPOT 一样优秀的 pipeline 模型。
Jan, 2018
本文提出了一种基于树的管道自动优化概念来自动化机器学习中最繁琐的步骤 —— 管道设计。作者提出了开源的 Python “基于树的管道优化工具”(TPOT),并在一系列模拟和真实的基准数据集上表明其有效性,该工具可以设计机器学习管道,该管道相比基本机器学习分析提供了显著改进,并且需要很少或没有用户输入和先前知识。作者还将 TPOT 偏向于设计过于复杂的管道的趋势与 Pareto 优化相结合,从而产生紧凑的管道而不牺牲分类准确性。因此,该工作代表了完全自动化机器学习管道设计的重要一步。
Mar, 2016
通过整合 AutoML 与数据管道,优化数据流的自动化机器学习方法并构建高效的数据管道以适应不断变化的数据环境,从而在机器学习任务中取得更好的结果。
Feb, 2024
我们提出了一个基于 Web 的一体化流程,能够进行数据预处理、训练、评估和可视化机器学习模型,无需手动干预或编程专业知识,通过集成传统机器学习和深度神经网络模型与可视化,帮助识别、分类、聚类和预测广泛的多模态、多传感器数据,包括图像、语言和一维数值数据,用于药物发现、病原体分类和医学诊断。
Mar, 2024
STREAMLINE 是一个简单、透明、端到端的自动化机器学习 (pipeline),旨在比较数据集、机器学习算法和其他 AutoML 工具的性能,在数据处理、模型比较方面提供一个全面和一致的基准。
Jun, 2022
本文提出了一种名为 SapientML 的自动机器学习技术,通过从现有数据集中学习人类编写的管道,实现针对新数据集的高质量管道的快速生成,采用了一种三阶段程序合成方法来进行搜索空间的有效管理。评估结果表明,在 41 个基准数据集中,SapientML 在 27 个基准数据集上的表现最佳或与最佳工具相当。
Feb, 2022
本文提出一种新的神经架构,将 Machine Learning pipeline 的组件嵌入到潜在表示中,通过 Bayesian Optimization 机制中的深度内核高斯过程模型在 meta-datasets 上搜索优化最优的 pipeline 嵌入,实验结果表明 pipeline 嵌入可以在 Pipeline Optimization 中取得最优结果。
May, 2023
本文介绍了自动化机器学习技术(AutoML)的研究现状,重点评估了多种 AutoML 工具在不同数据集、不同数据段上的表现和优缺点。
Aug, 2019
自动化机器学习系统提出了一种针对给定机器学习问题的端到端解决方案,创建了固定或灵活的流程。 EVOSA 方法通过引入敏感性分析来解决灵活流程的负面因素,并提高了灵活解决方案的鲁棒性和可解释性。
Dec, 2023