BriefGPT.xyz
大模型
Ask
alpha
关键词
performance characteristics
搜索结果 - 4
大型语言模型的演化推测及其在基准测试中的性能预测
PhyloLM 是一种应用系统发育算法于大型语言模型的方法,它探索了它们的微调关系并预测其性能特征。通过利用系统发育距离度量,我们构建了树状图,满意地捕捉到不同 LLM 族群(包括 77 个开源和 22 个闭源模型)。此外,系统发育距离能够
→
PDF
3 months ago
大型语言模型在新型人工智能加速器上的全面性能研究
研究了大型语言模型在多个人工智能加速器和图形处理器上的性能特性,并评估了这些模型的性能,考虑到序列长度、扩展行为、稀疏性和梯度积累步骤的敏感性。
PDF
9 months ago
KDD
GraphWorld: 通过虚构图形为 GNNs 提供实际见解
本研究提出了一个名为 GraphWorld 的基于人工合成图形的 GNN 模型基准测试方法,可以为 GNN 提供可调、可伸缩和易于使用的基准测试环境,并可以随机生成大量统计差异的数据集,经过实验表明,它可以揭示出传统基准测试中未观测到的模型
→
PDF
2 years ago
现代深度学习方法的参考工作负载
本文介绍了一个基于 TensorFlow 深度学习框架的工具集 Fathom,在研究 8 个深度学习模型的基础性能特征方面展开,从时间分配、性能特征、推理和训练行为等方面进行了分析。
PDF
8 years ago
Prev
Next