BriefGPT.xyz
Ask
alpha
关键词
compute resources
搜索结果 - 3
ElasticRec:一种基于微服务的模型服务架构,实现对推荐模型的弹性资源扩缩容
ElasticRec 是一种模型服务架构,为推荐系统提供资源弹性性和高内存效率。相较于现有推荐系统预测服务系统,ElasticRec 通过微服务的软件架构和基于效用的资源分配实现了平均内存分配大小的 3.3 倍减少、内存效用的 8.1 倍增
→
PDF
25 days ago
通过效率视角进行语言模型的规划
对使用 LLMs 进行规划的成本进行分析,指出最近的趋势极其不经济。我们提出了一种更高效的方法,并呼吁研究团体探索维持效率的基于 LLMs 的方法的负责任使用计算资源。
PDF
3 months ago
FourCastNeXt: 限制计算资源下提升 FourCastNet 训练效果
在本研究中,我们将展示可以仅使用基准模型计算资源的 1% 来训练 FourCastNet,同时保持模型性能甚至比基准模型更好。
PDF
6 months ago
Prev
Next