本研究比较了多种 AutoML 工具在开源数据集上的表现,发现 auto-sklearn 在分类数据集上表现最佳,而 TPOT 在回归数据集上表现最佳。
Aug, 2018
FAST-DAD是一种能够将复杂的模型集合精简为促进部署的个体模型的方法,它基于数据增强策略,并使用基于自注意力的伪似然估计器的吉布斯采样。在30个跨越回归和二元/多类分类任务的数据集上,FAST-DAD精炼方法得到的个体模型比在原始数据上进行标准培训获得的模型更快而且更准确,可以超过AutoML工具如H2O / AutoSklearn生成的集成预测器10倍以上。
Jun, 2020
这篇综述旨在推广对自动化/自主机器学习系统的更广阔视角,并探讨整合各种机制和理论框架的最佳方式。主要介绍超参数优化、多组件模型、神经架构搜索、自动特征工程、元学习、多层集成、动态自适应、多目标评估、资源限制、灵活的用户参与和泛化原则的发展。最终得出结论,建立自动化机器学习系统的架构整合是一个值得更深入探讨的重要问题。
Dec, 2020
提出了一种AutoML系统,其构建了可解释的加法模型,使用高度可扩展的分量提升算法进行拟合,提供了易于模型解释的工具,并且在预测性能上与其他基于AutoML比较系统相媲美,更易于使用和透明。
Sep, 2021
本文提出了一种基于序列推理过程的集成学习方法,通过逐步筛选难度较大的样本,动态调整模型的推理集成过程,从而同时优化推理的有效性和效率,实现了56%推理成本的减少,而维持与全集成模型相当的性能。
Jan, 2023
Assembled-OpenML是一个Python工具,可构建元数据集以在AutoML框架中使用集成学习技术,从而避免了基础模型的重复训练和评估。
Jul, 2023
本文研究了自动化机器学习中的模型集成方法,比较了不同方法在不同的度量标准下的性能表现,探讨了如何避免在使用数值优化方法时产生过拟合。
本文介绍了两种基于种群的集成选择方法QO-ES和QDO-ES,与现有的贪心集成选择方法GES进行比较,结果表明QO-ES和QDO-ES可以有效提高预测性能,但多样性也会增加过拟合的风险。
我们提出了cattleia——一个用于解读回归、多分类和二分类任务的集成模型的应用,通过评估度量、多样性和补充性度量以及可解释性人工智能技术,我们可以调整集成模型的权重和组件模型以满足特定需求,并通过交互式可视化来提供这些方面,从而支持决策和深化对自动机器学习框架的理解。
Mar, 2024
本文研究了一种简单的自适应推理方案,通过构建级联模型集成(CoE)并根据集成一致性作为数据依赖路由准则,将资源高效的模型逐渐扩展到更表达能力的模型,从而提高准确性并降低推理成本。
Jul, 2024