Jun, 2024

印度艺术音乐拉格识别的可解释深度学习分析

TL;DR本研究介绍了一个新的数据集 PIM-v1,其中包含了 191 小时的精心标注的北印度古典音乐录音,是我们所知最大的北印度古典音乐录音的标注数据集。我们使用 PIM-v1 数据集进行剔除实验,以找到自动识别 Ragas 的基准分类模型,为 12 种 Raga 类别的子集实现了 0.89 的段内 f1 - 分数。随后,我们使用模型可解释性技术评估分类器的预测,旨在确定其是否与人类对 Ragas 的理解相一致,还是由任意模式驱动。我们通过比较两个 ExAI 模型给出的解释与人类专家的注释来验证模型的预测的正确性。随后,我们分析个别测试样例的解释,以了解解释点亮的区域在模型的正确或错误预测中的作用。