Oct, 2023

逆距离加权注意力

TL;DR替换尺度点积注意力为负欧氏距离对网络产生了影响,简化成距离倒数加权插值;在简单单隐藏层网络上训练,使用标准交叉熵损失,倾向于生成包含原型的关键矩阵和相应逻辑回归的值矩阵;同时,我们还展示其结果可通过人工构建的原型增加特殊情况的处理能力,形成可解释的网络。