人工智能与节奏估计:综述
本文介绍了基于深度学习技术的音乐生成方法,包括早期使用人工神经网络的作品和最近的系统,使用现代深度学习技术和控制手段生成具有不同音乐风格的音乐。
Apr, 2020
本文提出了一种基于等变自监督信号来学习音频节奏表示的方法,避免了需要标注数据的缺点,而且不需要采用正则化或负采样等方法防止模型崩溃。实验证明,这种方法能够仅依靠等变自监督而获得与监督方法相当的性能,而且需要的计算资源较少,因此适用于广泛的研究社区。
Sep, 2022
本文介绍了一种新的基于语言提示生成音乐鼓点的方法,同时开发了提取歌曲鼓点的新方法,这为计算机辅助音乐制作提供了可能,并为更全面的节奏生成提供了基础。
Sep, 2022
本文提出了一个解决音乐音频全局速度估计问题的方法,采用完全自监督的方法,不依赖任何人工标记数据。该方法利用通用(音乐)音频嵌入已经编码了各种属性的事实,包括关于速度的信息,使其可以方便地适用于下游任务。在与现有最先进的方法进行比较时,我们的方法表现竞争力强,尤其是在对精确速度八度的约束放宽的情况下。
Jan, 2024
本研究探讨了应用循环神经网络识别音乐中传达的情感,旨在通过将音乐调整到适合听众的情感状态,增强音乐推荐系统并支持治疗干预。我们使用Russell的情感象限将音乐分类为四个不同的情感区域,并开发了能够准确预测这些类别的模型。我们的方法涉及使用Librosa提取全面的音频特征,并应用各种循环神经网络架构,包括标准RNN,双向RNN和LSTM网络。初步实验使用包含900个已标记情感象限的音频片段数据集进行,我们将神经网络模型的性能与一组基准分类器进行比较,并分析其在捕捉音乐表达中固有的时间动态方面的有效性。结果表明,在较小的数据集中,较简单的RNN架构的表现可能与更复杂的模型相当甚至更优。我们还在较大的数据集上应用了以下实验:一是基于我们原始数据集进行的增强,另一是来自其他来源。这项研究不仅增进了我们对音乐情感影响的理解,还展示了神经网络在创建更个性化和情感共鸣的音乐推荐和治疗系统方面的潜力。
May, 2024
音乐信息检索领域的自动音乐转录(AMT)是一项核心挑战,旨在将音频信号转换为音乐符号表示,本文扼要回顾了AMT在音乐信号分析中的关键作用,强调了由于音乐和谐的复杂和相互叠加的频谱结构而对AMT的重要性,通过对AMT中现有的机器学习技术的彻底研究,我们探讨了当前模型和方法的进展和限制。尽管有可观的进展,AMT系统尚未达到人类专家的准确度,这在很大程度上是由于音乐和谐的复杂性和对细致解释的需求。本综述批判性评估了全自动和半自动的AMT系统,强调了最小用户干预的重要性,并研究了迄今为止提出的各种方法。通过解决先前技术的限制并提出改进的途径,我们的目标是引导未来的研究朝着能够准确且高效地将复杂的音频信号转化为精确的符号表示的全自动AMT系统。本研究不仅综合了最新的进展,而且为克服AMT中的现有挑战提供了一个路线图,为研究人员提供了有价值的洞察,旨在缩小当前系统和人类级转录准确性之间的差距。
Jun, 2024
本研究系统回顾了人工智能在音乐生成领域的最新进展,针对技术、模型、数据集和评估方法进行了分类与比较,填补了对各种技术理解的空白。论文的主要贡献在于提供了完整的参考框架,探讨了AI音乐生成在实时交互和跨学科应用中的实用影响,并提出了未来研究方向与现存挑战。
Sep, 2024