Nov, 2023

级联:一种适用于延迟敏感边缘智能的平台

TL;DR互动智能计算应用越来越普遍,需要优化以降低每个事件的延迟,同时保持高吞吐量和高效的资源管理。Cascade 是一个新的 AI/ML 托管平台,旨在解决这个难题。创新之处包括最小化数据拷贝的兼容传统系统的存储层和最大化响应性能的数据与计算合并的 “快速路径”。我们的评估显示,Cascade 可以将延迟降低数个数量级,同时不损失吞吐量。