Nov, 2022
MAST:多尺度音频频谱变换器
MAST: Multiscale Audio Spectrogram Transformers
Sreyan Ghosh, Ashish Seth, S. Umesh, Dinesh Manocha
TL;DR本文提出了一个多尺度音频谱图变换器(MAST),用于音频分类和自监督学习,在 LAPE 基准测试上,相较于 Audio Spectrogram Transformer(AST)和 SSAST,MAST 和 SS‐MAST 具有更高的性能,并已将所有代码公开在 GitHub 上。