硬件感知的集成选择以平衡预测准确性和成本

Aug, 2024

硬件感知的集成选择以平衡预测准确性和成本

Hardware Aware Ensemble Selection for Balancing Predictive Accuracy and Cost

Jannis Maier, Felix Möller, Lennart Purucker

TL;DR本研究针对自动机器学习（AutoML）中后期集成导致的推理时间较长的问题，提出了一种硬件感知的集成选择方法。该方法综合考虑了预测准确性和硬件效率，通过实验证明了在维持竞争性准确度的同时，显著提升了集成模型的操作效率，为更加资源高效的AutoML系统奠定了基础。

Abstract

Automated Machine Learning (AutoML) significantly simplifies the deployment of machine learning models by automating tasks from data preprocessing to model selection to ensembling. AutoML systems for tabular data

发现论文，激发创造

自动机器学习框架的基准测试

本研究比较了多种 AutoML 工具在开源数据集上的表现，发现 auto-sklearn 在分类数据集上表现最佳，而 TPOT 在回归数据集上表现最佳。

Aug, 2018

增强蒸馏技术的表格数据快速准确简单模型

FAST-DAD是一种能够将复杂的模型集合精简为促进部署的个体模型的方法，它基于数据增强策略，并使用基于自注意力的伪似然估计器的吉布斯采样。在30个跨越回归和二元/多类分类任务的数据集上，FAST-DAD精炼方法得到的个体模型比在原始数据上进行标准培训获得的模型更快而且更准确，可以超过AutoML工具如H2O / AutoSklearn生成的集成预测器10倍以上。

Jun, 2020

自动机器学习的综合框架

这篇综述旨在推广对自动化/自主机器学习系统的更广阔视角，并探讨整合各种机制和理论框架的最佳方式。主要介绍超参数优化、多组件模型、神经架构搜索、自动特征工程、元学习、多层集成、动态自适应、多目标评估、资源限制、灵活的用户参与和泛化原则的发展。最终得出结论，建立自动化机器学习系统的架构整合是一个值得更深入探讨的重要问题。

Dec, 2020

自动分量提升：可解释性自动机器学习系统

提出了一种AutoML系统，其构建了可解释的加法模型，使用高度可扩展的分量提升算法进行拟合，提供了易于模型解释的工具，并且在预测性能上与其他基于AutoML比较系统相媲美，更易于使用和透明。

Sep, 2021

深度集成学习的推理效率优化

本文提出了一种基于序列推理过程的集成学习方法，通过逐步筛选难度较大的样本，动态调整模型的推理集成过程，从而同时优化推理的有效性和效率，实现了56%推理成本的减少，而维持与全集成模型相当的性能。

Jan, 2023

使用 OpenML 构建集成学习自动化机器学习的高效基准测试

Assembled-OpenML是一个Python工具，可构建元数据集以在AutoML框架中使用集成学习技术，从而避免了基础模型的重复训练和评估。

Jul, 2023

使用CMA-ES进行后续集成的AutoML：成就与挽救失败

本文研究了自动化机器学习中的模型集成方法，比较了不同方法在不同的度量标准下的性能表现，探讨了如何避免在使用数值优化方法时产生过拟合。

Jul, 2023

Q(D)O-ES:基于人口的自动机器学习中后验高斯集成选择的质量(多样性)优化

本文介绍了两种基于种群的集成选择方法QO-ES和QDO-ES，与现有的贪心集成选择方法GES进行比较，结果表明QO-ES和QDO-ES可以有效提高预测性能，但多样性也会增加过拟合的风险。

Jul, 2023

机器学习集成的解码：cattleia 辅助决策

我们提出了cattleia——一个用于解读回归、多分类和二分类任务的集成模型的应用，通过评估度量、多样性和补充性度量以及可解释性人工智能技术，我们可以调整集成模型的权重和组件模型以满足特定需求，并通过交互式可视化来提供这些方面，从而支持决策和深化对自动机器学习框架的理解。

Mar, 2024

重访级联集成以提高推理效率

本文研究了一种简单的自适应推理方案，通过构建级联模型集成（CoE）并根据集成一致性作为数据依赖路由准则，将资源高效的模型逐渐扩展到更表达能力的模型，从而提高准确性并降低推理成本。

Jul, 2024