Aug, 2023

PitchNet: 一种用于音高估计的全卷积神经网络

TL;DR在音乐和声音处理领域中,音高提取起着关键作用。本研究介绍了 “PitchNet”,一种专为从人类歌唱声音中提取音高而量身定制的卷积神经网络,包括 a cappella 演唱。将自相关与深度学习技术融合,PitchNet 旨在优化音高检测的准确性。通过对包含合成声音、歌剧录音和时间拉伸元音的数据集进行评估,证明了其有效性。这项工作为音乐和语音环境中的音高提取铺平了道路。