局限严重应用中的自动机器学习
本文提出了一种元学习方法,利用先前的元数据自动搜索高性能的机器学习管道以完成模型选择和超参数优化,该方法结合自适应贝叶斯回归模型、神经网络基函数和贝叶斯优化的收获函数,能够在监督分类数据集上高效地搜索预定义的候选管道,实验结果表明,该方法在一系列测试数据集上能够快速确定高性能的机器学习管道,并胜过基线方法。
Apr, 2019
本研究旨在针对数据漂移自动设计在线学习的管道,将在线学习器的固有适应能力与自动化管道的快速优化能力结合起来,我们基于异步遗传编程和异步连续缩减思路优化管道,实验证明了 OAML 系统在数据漂移情况下相比流行的在线学习算法具有更好的性能和适应能力,连续管道重新设计在处理数据漂移问题时效果显著。
Jan, 2022
我们提出了一种基于采样的 AutoML 方法,主要关注神经结构搜索和超参数优化,用于解决在构建大规模容量模型时的元规模生产中的挑战。我们的方法通过使用轻量级基于预测器的搜索器和强化学习来探索广泛的搜索空间,显著减少了模型评估的数量,在 CTR 和 CVR 应用的大容量建模实验中表现出杰出的投资回报率(ROI),相对于人工调优的基准,通过从精选的搜索空间中平均抽样一百个模型,达到高达 0.09% 的归一化熵(NE)损失减少或 25% 的每秒查询量(QPS)增加。我们的 AutoML 方法已经在实际应用中取得了成效,在 Instagram CTR 模型的大规模在线 A/B 测试中达到了高达 - 0.36% 的 NE 增益(相比现有的生产基准),并显示出统计上的显著改进。这些生产结果证明了 AutoML 的功效,并加速了它在 Meta 排名系统中的采用。
Nov, 2023
AutoMMLab 是一个通用的、基于 LLM(语言模型)驱动的 AutoML 系统,通过用户友好的语言界面,自动化计算机视觉任务的整个模型生产流程,并利用 LLM 作为桥梁连接 AutoML 和 OpenMMLab 社区,使非专家个体能够轻松构建特定任务的模型。
Feb, 2024
提出了一种多准则的 AutoML 系统,优化了用户定义的辅助标准,以引导搜索达到最佳的机器学习流程,以此来满足人工智能应用中不同的需求。
Aug, 2019
本文分析了自动机器学习在企业分析应用中的潜力,并将 H2O AutoML 框架与手工调整的 ML 模型在三个真实数据集上进行了基准测试,发现 H2O AutoML 框架快速、易用、可靠,表现接近手工调优的 ML 模型,是一个有价值的工具,能够支持快速原型设计,缩短开发和部署周期,并能够弥合 ML 专家供需之间的差距。
May, 2022
提出了一种基于 ADMM 的 AutoML 框架,可以将优化问题分解为易于处理的子问题,并整合黑箱约束以及优化目标函数。在 UCI ML 和 OpenML 数据集上的实验表明,相比其他的 AutoML 方法,该框架具有更大的灵活性、更高的效果和独特的能力。
May, 2019
本研究通过对 19 名 AutoML 用户进行半结构化访谈,发现用户在实际应用中需要面对可定制性、透明度和隐私等方面的限制,并采取一定策略来应对,最终对 AutoML 的使用产生影响。研究结果提出了未来开发 AutoML 解决方案的设计建议。
Feb, 2023
自动化机器学习(AutoML)是一个研究领域,专注于开发自动生成机器学习模型的方法。本文提出了一个建立通用 AutoML 系统的参考框架,并通过对该领域主要方法的叙述性回顾,提炼了基本概念以支持其设计,并讨论了 AutoML 应用中的一些未解决问题,以供未来研究参考。
Aug, 2023