Feb, 2022
MLProxy: 面向无服务器计算平台的 SLA 感知机器学习推理反向代理
MLProxy: SLA-Aware Reverse Proxy for Machine Learning Inference Serving on Serverless Computing Platforms
Nima Mahmoudi, Hamzeh Khazaei
TL;DR本文介绍了 MLProxy,它是一种自适应反向代理,支持在无服务器计算系统上高效地处理机器学习服务工作负载。通过适应性批处理,MLProxy 可以确保满足 SLA 要求的同时优化无服务器成本,为服务器无部署降低了高达 92%的成本,同时将 SLA 违规降低了高达 99%。