BriefGPT.xyz
Ask
alpha
关键词
speed improvements
搜索结果 - 2
基于相量驱动的快速傅里叶变换卷积神经网络加速
通过使用极相表达形式作为替代传统方法的更高效的选择,我们的方法在 CIFAR-10 和 CIFAR-100 数据集上相较于现代 CNN 架构采用的矩形形式,实现了训练和推断速度的最高提升分别达到 1.376 和 1.390。同时,我们的方法
→
PDF
a month ago
超级关注力:近线性时间的长篇长文本关注力
我们提出了一个名为 HyperAttention 的近似注意力机制,用于解决大型语言模型(LLMs)中使用的复杂长上下文所带来的计算挑战。通过引入两个参数来衡量问题的难度,我们能够实现线性时间采样算法,即使矩阵具有无界的条目或较大的稳定秩。
→
PDF
9 months ago
Prev
Next