BriefGPT.xyz
Ask
alpha
关键词
helix
搜索结果 - 2
Helix: 基于异构 GPU 上的最大流进行大型语言模型的分布式服务
介绍了一种名为 Helix 的分布式系统,用于在异构 GPU 集群上提供高吞吐量和低延迟的大语言模型(LLM)服务。通过将 LLMs 的推理计算以最大流问题形式表示为有向加权图,使用混合整数线性规划(MILP)算法来发现高度优化的策略,从而
→
PDF
a month ago
加速人机协同机器学习:挑战与机遇
该研究描述了一种 “人机互动” 机器学习系统的愿景,它通过智能跟踪更改和中间结果,实现了工作流加速,反馈及时,内省和调试,背景执行和自动化,并描述了 Helix,初步尝试这样一个系统已经在典型的迭代工作流中实现了最多 10 倍的提速。
PDF
6 years ago
Prev
Next