MMMar, 2016

一种基于树形结构的管道优化工具用于自动化数据科学的评估

TL;DR本文提出了一种基于树的管道自动优化概念来自动化机器学习中最繁琐的步骤 —— 管道设计。作者提出了开源的 Python “基于树的管道优化工具”(TPOT),并在一系列模拟和真实的基准数据集上表明其有效性,该工具可以设计机器学习管道,该管道相比基本机器学习分析提供了显著改进,并且需要很少或没有用户输入和先前知识。作者还将 TPOT 偏向于设计过于复杂的管道的趋势与 Pareto 优化相结合,从而产生紧凑的管道而不牺牲分类准确性。因此,该工作代表了完全自动化机器学习管道设计的重要一步。