Mar, 2020

AutoGluon-Tabular: 结构化数据稳健准确的自动机器学习

TL;DRAutoGluon-Tabular 是一个开源的 AutoML 框架,仅需一行 Python 代码即可训练基于未经处理的表格数据集(如 CSV 文件)的高精度机器学习模型。与现有的 AutoML 框架主要侧重于模型 / 超参数选择不同,AutoGluon-Tabular 通过组合多个模型并堆叠它们来成功地实现了目标。多层组合多模型的实验证明,它比寻找最佳模型更能更好地利用分配的训练时间。我们还对公共和商业 AutoML 平台进行了广泛的评估,包括 TPOT,H2O,AutoWEKA,auto-sklearn,AutoGluon 和 Google AutoML Tables。在 Kaggle 和 OpenML AutoML Benchmark 的 50 个分类和回归任务套件上进行的测试表明,AutoGluon 更快、更稳定,更准确。我们发现 AutoGluon 甚至经常超过所有竞争对手的最佳组合。在两个热门的 Kaggle 比赛中,AutoGluon 仅在原始数据上进行了 4 小时的训练,就胜过了 99% 的参赛数据科学家。