关键词inference serving
搜索结果 - 2
  • Llumnix: 大规模语言模型服务的动态调度
    PDFa month ago
  • 迈向更环保的 LLM:将能源效率置于 LLM 推理的前沿
    PDF3 months ago
Prev
Next