Feb, 2024

关系函数和注意力机制的近似

TL;DR通过分析内积关系,研究了神经网络特征图的内积在模拟输入之间的关系方面的广泛应用,证明了多层感知器自身的内积是对称正定关系函数的普遍逼近器,而两个不同多层感知器的内积是非对称关系函数的普遍逼近器,并通过内积关系将任何抽象预订定义的检索机制近似为注意力机制,从而应用于分析Transformer背后的注意力机制。同时,利用经济学中的Debreu表示定理以效用函数的形式表示偏好关系。