May, 2023

MoCA: 面向内存、适应性执行的多租户深度神经网络

TL;DR本文提出了一个基于 MoCA 的自适应多租户系统,该系统通过动态管理共享内存资源来实现不同深度神经网络的优化部署,以提高系统利用率并减少质量服务的下降,通过实验证明 MoCA 可以显著提高服务等级协议的满意度和系统效率,同时减少负载抢占的情况。