基于数据驱动的中层次音乐特征建模方法
本文提出了一种名为 Music FaderNets 的框架,该框架能够使用有限的数据来学习高层次的 feature representations,并通过对应的低层次属性进行建模,使用高斯混合变分自编码器 (GM-VAEs) 进行半监督聚类,实现高层次特征的推断,进而可以将该框架应用于不同情感状态下的风格转换任务中。
Jul, 2020
本文旨在研究多模态方法是否能在高级歌曲特征和歌词上比单一模态更好地预测歌曲情感得分,结果显示多模态特征在预测愉悦度时比纯音频好,其中 5 种高级歌曲特征对模型性能的贡献最大。
Feb, 2023
本研究提出了两种解释深度学习音乐数据的高级概念方法,包括有监督学习和无监督学习。对一个已有的符号作曲家分类系统进行演示并展示其局限性。
Aug, 2022
本文介绍了 MusicFrameworks,这是一种基于深度学习的分层音乐结构表示方法;并提出了一种多步骤的生成过程,根据长期重复结构、和弦、旋律轮廓和节奏约束生成完整的旋律。研究结果表明,其中一半的旋律比起 POP909 数据集中由人类作曲家创作的音乐更好或同样好。
Sep, 2021
本研究概述了当前流行的各种利用深度学习算法进行不同音乐生成层次的生成音乐任务,并总结了适用于各种任务的数据集、音乐表示、评估方法以及挑战,同时指出了几个未来的研究方向。
Nov, 2020
在音乐流媒体平台时代,自动标记音乐音频的任务引起了广泛关注,驱使研究人员设计旨在提高标准数据集上性能指标的方法。本研究探讨了可解释性在自动音乐标记领域的相关性,构建了一个包含三种不同信息提取技术的工作流程,并使用这些特征训练了一个可解释的机器学习模型进行标签预测。通过在 MTG-Jamendo 数据集和 GTZAN 数据集上进行实验,我们的方法在两个任务中均超过了基线模型的性能,并在某些情况下展现出与当前最先进方法的竞争力。我们得出结论,在某些情况下,解释性的价值超过了性能的下降。
Dec, 2023
本文介绍和分析运用人工神经网络生成音乐的不同方法,提出五个维度分析框架,包括目标、表示法、体系结构、挑战和策略,通过比较分析不同模型和技术,提出了一种新的多维分类法,并举例说明了目标、表示法、体系结构、挑战和策略的各种选择。
Sep, 2017
本文研究了音乐流行度的定义、特征及其是否可预测,定义了 8 个流行度度量,通过长期真实世界图表数据进行分析并使用声学数据建立分类模型进行预测。结果表明,使用音频信号,尤其是复杂度和 MFCC 特征,可以明显提高歌曲流行度度量的预测性能。
Dec, 2018
模拟音乐结构在生成符号音乐作品的人工智能系统中至关重要但具有挑战性。本文概述了整合连贯结构的技术的演变,从符号方法到基础和转换的深度学习方法,利用计算和数据在各种训练范式中的强大能力。最新阶段,我们评述了一种新兴技术,称为 “子任务分解”,它涉及将音乐生成分解为独立的高级结构规划和内容创作阶段。这些系统通过提取旋律的骨架或结构模板来引导生成过程,从而纳入某种形式的音乐知识或神经符号方法。从审查的三个时期来看,已经取得了在主题和重复方面的进展,但在模拟人类作曲家风格下的扩展音乐作品中细微主题的发展仍然很困难。我们概述了几个关键的未来方向,以实现结合所有考察时期方法的协同效益。
Mar, 2024
本研究旨在揭示西方流行音乐中基本音乐要素的普遍用法模式和指标,其中许多模式和指标在 50 多年的时间里始终保持稳定,但也证明了与音高转换限制、音色板调一致性和响度水平增加相关的重要变化或趋势。
May, 2012