BriefGPT.xyz
Jun, 2024
数据工程流水线工具调查
A Survey of Pipeline Tools for Data Engineering
HTML
PDF
Anthony Mbata, Yaji Sripada, Mingjun Zhong
TL;DR
数据工程领域中的一项研究调查了不同类型的流水线工具,包括ETL/ELT、数据集成、数据管道编排和工作流管理以及机器学习流水线,揭示了这些工具在数据准备方面的应用以及为机器学习准备数据的方法和案例。
Abstract
Currently, a variety of
pipeline tools
are available for use in
data engineering
. Data scientists can use these tools to resolve
data wrangling
→