BriefGPT.xyz
Ask
alpha
关键词
subnetact
搜索结果 - 1
SuperServe:面向不可预知工作负载的细粒度推断服务
通过在权重共享的 SuperNetworks 中插入专门的操作符,SubNetAct 机制动态地将请求导向网络以满足延迟和准确性目标,从而同时提供覆盖延迟 - 准确性权衡空间的全范围模型服务。SuperServe 系统在 Microsoft
→
PDF
6 months ago
Prev
Next