Oct, 2023

基于多项式的注意力机制的表示能力

TL;DR通过理论分析高次多项式注意力机制的表达能力,我们指出高次多项式对于放大大值和区分数据集方面的更高效性,为在注意力机制中引入更高次多项式以捕捉复杂的语言关联提供了理论依据。