Feb, 2022

MLProxy: 面向无服务器计算平台的 SLA 感知机器学习推理反向代理

TL;DR本文介绍了 MLProxy,它是一种自适应反向代理,支持在无服务器计算系统上高效地处理机器学习服务工作负载。通过适应性批处理,MLProxy 可以确保满足 SLA 要求的同时优化无服务器成本,为服务器无部署降低了高达 92%的成本,同时将 SLA 违规降低了高达 99%。