BriefGPT.xyz
Ask
alpha
关键词
model cascades
搜索结果 - 2
CascadeServe: 解锁模型级联进行推理服务
CascadeServe 通过使用模型级联进行端到端的推理服务自动化和优化,在不同工作负载上与现有技术进行比较时,在延迟 - 准确性空间的广泛范围内可以节约 2-3 倍的成本。
PDF
16 days ago
IDK Cascades:通过避免过分思考加速深度学习
通过引入基于类别不对称的模型级联框架 (IDK),充分利用预训练模型集合,实现深度学习推断加速和成本降低,无需重新训练模型。在多个基准测试中验证了该框架的有效性。
PDF
7 years ago
Prev
Next