BriefGPT.xyz
大模型
Ask
alpha
关键词
accuracy predictor
搜索结果 - 4
通过准确度预测器修剪大型语言模型
基于新的剪枝方法与准确度预测模型,本研究提出一种能够自动选择最佳模型的压缩方法,实验证明其有效性和高效性。相较于基准模型,Wikitext2 和 PTB 上的困惑度分别降低了 9.48% 和 5.76%,而平均 MMLU 准确度提高了 6.
→
PDF
10 months ago
ICCV
Zen-NAS:高性能深度图像识别的零样本 NAS
本文介绍了一个新的神经架构搜索算法,该算法使用零取样指数 Zen-Score 代替了传统的精度预测器,并且只需要少量前向推断即可计算 Zen-Score。建立在 Zen-Score 基础上,提出了 Zen-NAS 算法,能够在不使用数据的情
→
PDF
3 years ago
ChamNet:通过针对平台的模型适应实现高效的网络设计
该论文提出了一种称为 Chameleon 的高效神经网络架构设计方法,它能够利用现有的高效网络建立模块,并专注于利用硬件特征和适应计算资源以适应目标延迟和 / 或能量限制。通过一系列准确性和资源(延迟和 / 或能量)预测器,该算法能够在各种
→
PDF
6 years ago
TAPAS: 用于架构搜索的无需训练的准确性预测器
该研究提出了一种新的深度神经网络准确性预测器,可以预测未知输入数据集的分类性能,在不需要任何训练的情况下,在单个 GPU 上每秒超过 100 个网络,大规模架构搜索只需要几分钟。
PDF
6 years ago
Prev
Next