Jun, 2023

PrimaDNN:面向特征的 DNN 歌唱技巧检测定制

TL;DR本文提出了一种基于深度神经网络且考虑数据特征的 CRNN 模型 PrimaDNN,使用音高信息和多分辨率 Mel 频谱作为输入特征,采用 Squeeze-and-excitation (SENets) 与 Instance normalization 卷积模块,成功检测 J-POP 歌唱技巧,并获得了最佳的 44.9% 的宏平均 F 计量结果。