Oct, 2022

WISE: 提高 Transformer 长序列学习能力的小波变换

TL;DR本文即系统地研究了小波变换和 Transformer 之间的协同作用,提出了 WISE 范式,通过应用前向小波变换、在小波系数空间中进行非线性变换、通过反向小波变换在输入空间中重构表示的方法,用固定或自适应小波在小波空间中学习注意力可以一致地改善 Transformer 的性能,并且明显优于基于傅里叶变换的方法。