BriefGPT.xyz
Ask
alpha
关键词
custom kernels
搜索结果 - 2
更快的邻域注意力机制:在线程块级别降低自注意力的 O (n^2) 复杂度
邻域自注意力通过限制每个标记的注意力范围为其最近的邻居来降低自注意力的成本。这种限制通过窗口大小和膨胀因子参数化,绘制了在线性投影和自注意力之间的一系列可能的注意力模式。我们将邻域注意力表示为分批 GEMM 问题,实现了 1-D 和 2-D
→
PDF
4 months ago
Kernel-U-Net 多变量时序预测的层次和对称框架
时间序列预测任务基于历史信息预测未来趋势。本文提出了一种对称和分层的框架,Kernel-U-Net,它在网络的每一层将输入序列切分成片段,然后使用内核对其进行计算。与现有的线性或 Transformer 解决方案相比,我们的模型具有三个优势
→
PDF
6 months ago
Prev
Next