BriefGPT.xyz
大模型
Ask
alpha
关键词
spectrogram transformer
搜索结果 - 2
多尺度音频光谱变换器用于有效的音频分类
这篇研究提出了一种名为多尺度音频谱变换器(MAST)的方法,它采用分层表示学习来提高音频分类的效率,相较于 AST,MAST 在没有外部训练数据的情况下,在 Kinetics-Sounds,Epic-Kitchens-100 和 VGGSo
→
PDF
a year ago
AAAI
SSAST: 自监督音频频谱变换器
本文提出了一种使用未标注数据进行自监督预训练的方法,使用联合判别式和生成式掩蔽频谱补丁建模对 AST 模型进行预训练,从而显著提高音频分类性能。这是音频领域中第一个基于补丁的自监督学习框架,也是 AST 的自监督学习框架的首次探索。
PDF
3 years ago
Prev
Next