BriefGPT.xyz
Ask
alpha
关键词
random projection technique
搜索结果 - 1
自注意力矩阵的表达能力
本文研究了 Transformer 网络中的自注意力矩阵,重点分析了稀疏模式的逼近。我们证明了通过固定自注意力参数,采用不同的输入即可逼近各种稀疏矩阵,并提出了一种基于随机映射技术的构造性证明和算法。尤其是,在保持矩阵元素比率不变的精度下,
→
PDF
3 years ago
Prev
Next