Jul, 2023

Pathway:一种快速灵活的统一流数据处理框架,用于分析和机器学习应用

TL;DR我们提出了 Pathway,这是一个新的统一数据处理框架,可以在有界和无界数据流上运行工作负载。该框架旨在解决分析和处理物理经济数据时面临的挑战,包括物联网和企业系统生成的数据流。我们描述了该系统,并展示了其在批处理和流处理环境中的能力,超过了业界最先进的框架。我们还讨论了 Pathway 处理的流处理用例,这些用例无法轻松解决使用业界最先进的框架,例如流迭代图算法(PageRank 等)。