Oct, 2020

LazyBatching:面向云机器学习推断的考虑 SLA 的批处理系统

TL;DR本研究提出了考虑调度和分批的 LazyBatching 技术,采用独立的图节点粒度实现了对动态推理请求的优化,并比 Graph batching 在平均响应时间、吞吐量和 SLA 满足度方面实现了 15 倍、1.5 倍和 5.5 倍的提高。