Jun, 2023

多窗口关注遮蔽自编码器更好的音频学习者

TL;DR本篇研究提出了一种使用多窗口的遮盖自编码器和多头注意力机制进行多领域音频数据建模的方法,并对比了标准遮盖自编码器的性能效果和特征获取能力。实验结果表明,多窗口的遮盖自编码器在处理多领域音频数据时具有更好的性能和特征提取能力,并且获得了更加独立的特征分层。