卷积循环神经网络用于音乐分类
本文提出了一种基于卷积神经网络的新型架构,用于解决音乐信息检索中的 Cover Song Identification 问题,随着分类策略的应用,该网络可训练出对节奏变化具有鲁棒性的模型,实验证明该方法在解决 cover song identification 问题方面表现优异。
Nov, 2019
本文提出了一种新的框架,用于检测监督句子分类中的冗余。我们的模型结合字符感知卷积神经网络(Char-CNN)和字符感知循环神经网络(Char-RNN)形成卷积循环神经网络(CRNN)。我们比较了我们的框架与四个流行基准语料库上的最先进的文本分类算法,包括 Google-news 数据集、twenty-new-groups 数据流、Brown Corpus、question collection 的效果,并分析了三种不同的 RNN 隐性循环单元的性能和运行效率的影响。我们的模型在各个数据集上都取得了具有竞争力的精度和召回率,这表明我们的模型在文本分类中能够有效地降低监督句子分类的冗余。
Jun, 2017
本研究探讨了应用循环神经网络识别音乐中传达的情感,旨在通过将音乐调整到适合听众的情感状态,增强音乐推荐系统并支持治疗干预。我们使用 Russell 的情感象限将音乐分类为四个不同的情感区域,并开发了能够准确预测这些类别的模型。我们的方法涉及使用 Librosa 提取全面的音频特征,并应用各种循环神经网络架构,包括标准 RNN,双向 RNN 和 LSTM 网络。初步实验使用包含 900 个已标记情感象限的音频片段数据集进行,我们将神经网络模型的性能与一组基准分类器进行比较,并分析其在捕捉音乐表达中固有的时间动态方面的有效性。结果表明,在较小的数据集中,较简单的 RNN 架构的表现可能与更复杂的模型相当甚至更优。我们还在较大的数据集上应用了以下实验:一是基于我们原始数据集进行的增强,另一是来自其他来源。这项研究不仅增进了我们对音乐情感影响的理解,还展示了神经网络在创建更个性化和情感共鸣的音乐推荐和治疗系统方面的潜力。
May, 2024
本文提出将 CNN 与 CTC 相结合的端到端语音识别框架,以实现序列标记;在 TIMIT 音素识别任务中评估该方法并表明其在计算效率和性能上优于已有基线系统,并指出 CNN 具有利用适当上下文信息来建模时间相关性的能力。
Jan, 2017
本文针对 SemEval 2010 关系分类任务,研究了两种不同的神经网络结构:卷积神经网络和循环神经网络。我们分别演示了模型不同结构的效果,并提出了一种针对卷积神经网络的新型上下文表示法和针对连接主义双向循环神经网络的排名损失优化方法。最后,我们展示了使用简单投票方案将卷积神经网络和循环神经网络结合起来可以提高结果的准确性。我们的神经模型在 SemEval 2010 关系分类任务上获得了最先进的结果。
May, 2016
本文介绍了一种基于改进了的 1 维卷积神经网络架构的音乐自动标记方法,该方法采用最先进的图像分类模型 ResNets 和 SENets 构建块,并添加多级特征聚合。结果表明,此方法在 MagnaTagATune 数据集上取得了显著改进,并在 Million Song 数据集上取得了可比结果。
Oct, 2017
本文对于近三十年来产生和实践了重要的循环神经网络(RNN),LSTM 和 BRNN 等模型的研究进行综述,旨在提供一个自成体系的最前沿阐述和历史视角,并引用了相关研究文献。
May, 2015
本文研究了将深度网络的多层表示与强大的 RNN 模型相结合的模型 - 深度递归神经网络,通过合适的正则化和端到端的训练方法,该模型在 TIMIT 语音识别基准测试中获得了最佳记录得分 17.7%。
Mar, 2013
本文提出了一种基于循环神经网络的简单框架,并将其与基于卷积神经网络的模型进行比较。该模型在处理句子关系分类问题时具有学习长距离依赖关系模式的优点,并在使用 MIMLRE 数据集的实验中表现出优异的性能。
Aug, 2015