BriefGPT.xyz
Ask
alpha
关键词
data movement
搜索结果 - 5
可直接在压缩数组上执行的操作及误差是多少?
我们开发了一种损失压缩器,可在压缩数据的同时直接执行基本操作,具有良好的压缩比和适度的误差。通过在三个非平凡应用中进行评估,我们的结果表明,在可接受的限度内,压缩域操作在问题规模上具有良好的可扩展性。据我们所知,这是第一种既支持压缩域操作,
→
PDF
19 days ago
PowerFusion:一种具有显式数据移动描述和指令级图形 IR 的张量编译器
本文提出 IntelliGen 这样一个基于 GIR 表示的张量编译器,该编译器通过综合优化不同的内存访问模式和计算操作,能够针对内存密集运算符生成高性能代码,相比当前最有效的框架,IntelliGen 在 NVIDIA GPU、AMD G
→
PDF
a year ago
HammingMesh:用于大规模深度学习的网络拓扑结构
通过分析大规模深度学习训练的工作量,我们设计了一种网络拓扑结构 HammingMesh,它支持两个方向的并行计算,提供高带宽和灵活的作业调度,将为未来需要极高带宽的大规模深度学习系统提供强大的支持。
PDF
2 years ago
数据移动即所需:优化 Transformer 的案例研究
该研究提出了一种全局优化 transformers 数据传输的方法,通过减少数据传输的步骤,实现了对 BERT 编码器层的训练性能提升 1.30 倍以及整个 BERT 的训练性能提升 1.19 倍。此方法可更广泛地应用于优化深度神经网络,提
→
PDF
4 years ago
一种快速分析的完全关联高速缓存模型
提出一种轻量级的缓存模型,使用最近最少使用置换策略并使用符号计数技术来计算缓存丢失,从而提供精确的数据放置信息,以使软件开发变得更加适应内存层次结构。
PDF
5 years ago
Prev
Next