May, 2024

规模化分布式空间架构上高效 AI 工作流执行

TL;DR给定了日益复杂的人工智能应用,我们通过分析发现了一种相互连接的、多方面任务的模式,涵盖了人工智能和一般计算过程。对此,我们提出了 “Orchestrated AI Workflows” 的概念,将各种任务与逻辑驱动的决策整合成动态而复杂的工作流程。同时,我们提出了 Octopus,一个针对执行 Orchestrated AI Workflows 而优化的可扩展的空间架构和一套先进的调度策略,它在处理动态需求方面显著优于传统架构,并在大规模硬件(如大规模芯片)上具有强大的可扩展性。