Jan, 2024

由粗到细:音频谱图变压器的高效训练

TL;DR通过连接粗到细的想法,将变压器模型应用于低分辨率数据进行优化训练,然后在课程学习策略下,使用高分辨率数据进行微调,实验结果表明,这种 AST 的训练机制导致性能提升,收敛速度更快,需要的计算资源和时间更少。