Dec, 2018
InferLine: 面向严格延迟目标的 ML 预测流水线供应和管理
InferLine: ML Prediction Pipeline Provisioning and Management for Tight Latency Objectives
Daniel Crankshaw, Gur-Eyal Sela, Corey Zumar, Xiangxi Mo, Joseph E. Gonzalez...
TL;DR本文提出了 InferLine 系统,该系统由低频组合规划器和高频自动化调试器组成,能够根据查询到达流程的变化自动调整各个阶段的自动缩放到达目标的阈值,从而实现最小化成本或实现服务水平目标,有效解决了跨多个模型和硬件加速器的 ML 预测流程的优化配置问题。