Dec, 2016

Clipper: 一个低延迟的在线预测服务系统

TL;DR本文介绍了 Clipper,一个用于部署机器学习模型的通用低延迟预测服务系统,通过引入缓存、批处理和自适应模型选择技术,Clipper 提高了在线服务应用的预测时延、准确性和吞吐量,并可支持模型组合和在线学习来提高准确性和鲁棒性。与 TensorFlow Serving 系统相比,我们能够实现可比的吞吐量和延迟。