BriefGPT.xyz
大模型
Ask
alpha
关键词
performance model
搜索结果 - 6
GNNBuilder:通用图神经网络加速器生成、仿真和优化的自动化框架
本文介绍了 GNNBuilder,这是第一个自动化的、通用的、端到端的 GNN 加速器生成框架,支持各种由用户任意定义的 GNN 模型,并拥有精确的性能模型和设计空间探索功能。实验结果显示,GNNBuilder 生成的加速器可以比 CPU
→
PDF
a year ago
分布式训练系统中梯度压缩的效用
为了解决同步数据并行训练中的通信瓶颈,本研究评估了梯度压缩方法的有效性,并将它们的可扩展性与优化后的同步数据并行 SGD 实现进行了比较。分析发现,仅有 6 种情况下,梯度压缩方法提供了速度优势。本研究提出了一种性能模型,用于确定在各种系统
→
PDF
3 years ago
更加健壮的双重偏差离线评估
本文针对强化学习中的离策略评估问题,提出了一种名为 MRDR 的更加鲁棒的 Doubly Robust 估计方法,该方法通过最小化 DR 估计器的方差来学习模型参数,并在上下文决策和强化学习基准问题中进行评估,证明了其强一致性和渐进最优性。
PDF
6 years ago
使用稀疏卷积和指导剪枝加速 CNN
本文提出一种同时实现卷积神经网络的规模经济和速度提升的方法,包括一种有效的一般性稀疏 - 稠密矩阵乘法实现以及一种性能模型,可以预测不同层和不同计算机架构的稀疏水平的最佳值,该方法可在包括移动设备和超级计算机在内的各种处理器上实现 3.1-
→
PDF
8 years ago
并发程序的定量综合
针对并发程序的定量、性能感知综合算法,以一个非确定性部分程序和一个参数化性能模型为输入,用加权自动机捕捉系统体系结构,通过 2 - 人图游戏解决良性性能最优化问题。我们提出了一种算法方法和实现原型工具,可用于构造各种性能模型和编程模式的有限
→
PDF
13 years ago
算法选择作为带无限损失的赌博机问题
本文提出一种将算法选择表示为部分信息的赌博问题的简单框架,并将现有的求解器适应于该游戏,证明了其期望遗憾的边界,该算法选择技术的也适用于此。
PDF
16 years ago
Prev
Next