BriefGPT.xyz
Ask
alpha
关键词
deployment costs
搜索结果 - 2
S2D:排序的推测解码,用于更高效部署嵌套大型语言模型
部署异步大型语言模型(LLMs)的代价高昂,为了减少成本,本文介绍了一种新的多目标场景的 Draft 模型部署方法,并提出了一种更高效的排序 Speculative Decoding 机制,该方法在多目标环境下优于基线模型。
PDF
8 days ago
MM
MEET:运动增强边缘智能,用于智能和绿色 6G 网络
提出了一种基于智能连接车辆的移动增强边缘智能(MEET)框架,利用车辆的感知、通信、计算和自供能力来打造智能、绿色的 6G 网络,从而实现成本效益和可持续性。
PDF
2 years ago
Prev
Next