Jun, 2023
基于时间 - 频率感知器的多轨音乐转录
Multitrack Music Transcription with a Time-Frequency Perceiver
Wei-Tsung Lu, Ju-Chiang Wang, Yun-Ning Hung
TL;DR本文提出了一种新型的深度神经网络结构 Perceiver TF,用于多音轨音乐转录,通过引入分层扩展和额外的 Transformer 层来建模音频输入的时间 - 频率表示,从而实现 12 种乐器和声音的多任务学习,结果表明该系统在各种公共数据集上的性能优于现有的其他对手。