Jun, 2023

基于时间 - 频率感知器的多轨音乐转录

TL;DR本文提出了一种新型的深度神经网络结构 Perceiver TF,用于多音轨音乐转录,通过引入分层扩展和额外的 Transformer 层来建模音频输入的时间 - 频率表示,从而实现 12 种乐器和声音的多任务学习,结果表明该系统在各种公共数据集上的性能优于现有的其他对手。