Jul, 2024

MERGE -- 一种用于静态音乐情感识别的双模态数据集

TL;DR音乐情感识别(MER)领域近年来有稳定发展,深度学习和机器学习等方法对该领域做出了贡献。本文提出了三个新的音频、歌词和双模MER研究数据集,合称为MERGE,旨在解决双模音频-歌词系统发展中存在的公共和大规模数据库匮乏问题。通过特征工程、机器学习和深度学习方法,在每种模式下进行了多个实验,以全面评估所提出的数据集,并建立了基准进行比较。实验结果证实了所提出数据集的可行性,使用深度神经网络在双模分类任务上取得了79.21%的最佳综合F1分数。