Sep, 2023

EnCodecMAE: 利用神经编解码器进行通用音频表示学习

TL;DR本研究探讨了使用神经音频编解码器 EnCodec 生成发音、音乐和环境声音的离散目标,以学习基于遮蔽自动编码器的通用音频模型 EncodecMAE,并在广泛的音频任务中取得了与领先的音频表示模型相媲美或更好的性能。