BriefGPT.xyz
Ask
alpha
关键词
ernie-sparse
搜索结果 - 1
ERNIE-SPARSE: 基于自注意力正则化的分层高效 Transformer 学习
提出 ERNIE-Sparse 模型,它包含两个不同的部分:分层稀疏 Transformer(Hierarchical Sparse Transformer,HST)和自注意力正则化(Self-Attention Regularizatio
→
PDF
2 years ago
Prev
Next