Nov, 2022

MAST:多尺度音频频谱变换器

TL;DR本文提出了一个多尺度音频谱图变换器(MAST),用于音频分类和自监督学习,在 LAPE 基准测试上,相较于 Audio Spectrogram Transformer(AST)和 SSAST,MAST 和 SS‐MAST 具有更高的性能,并已将所有代码公开在 GitHub 上。