BriefGPT.xyz
Ask
alpha
关键词
data scheduler
搜索结果 - 2
EMNLP
文本图的复杂性导向课程学习
基于现有的文本和图形复杂性形式主义的知识,我们提出了一种基于课程学习的方法,它通过多样性示例的暴露来逐步训练、根据任务要求精炼训练,并通过迭代训练过程中使用 “间隔重复” 和复杂性形式主义来指导训练。我们在几个文本图形任务和图形神经网络架构
→
PDF
7 months ago
SALO: 一种高效的空间加速器,支持长序列的混合稀疏注意机制
本文提出了一种名为 SALO 的加速器,能够使得 Transformer 等注意力机制在处理长序列时具有更好的性能,并通过实验证明 SALO 相比于典型工作负载下的 GPU 和 CPU 实现,分别具有 17.66 倍和 89.33 倍的加速
→
PDF
2 years ago
Prev
Next