钢琴演奏评估中的音乐形态评价双塔残差神经网络

Jan, 2024

钢琴演奏评估中的音乐形态评价双塔残差神经网络

Siamese Residual Neural Network for Musical Shape Evaluation in Piano Performance Assessment

Xiaoquan Li, Stephan Weiss, Yijun Yan, Yinhe Li, Jinchang Ren...

TL;DR通过提出轻量级的 Siamese 残差神经网络 (S-ResNN) 来自动识别音乐形态，并通过在钢琴音乐形态评估上的实验证明 S-ResNN 在精确率、召回率和 F1 得分方面明显优于其他基准方法。

Abstract

Understanding and identifying musical shape plays an important role in music education and performance assessment. To simplify the otherwise time- and cost-intensive →

musical shape artificial intelligence classification neural network performance assessment

发现论文，激发创造

使用循环神经网络进行音乐情感预测

本研究探讨了应用循环神经网络识别音乐中传达的情感，旨在通过将音乐调整到适合听众的情感状态，增强音乐推荐系统并支持治疗干预。我们使用 Russell 的情感象限将音乐分类为四个不同的情感区域，并开发了能够准确预测这些类别的模型。我们的方法涉及使用 Librosa 提取全面的音频特征，并应用各种循环神经网络架构，包括标准 RNN，双向 RNN 和 LSTM 网络。初步实验使用包含 900 个已标记情感象限的音频片段数据集进行，我们将神经网络模型的性能与一组基准分类器进行比较，并分析其在捕捉音乐表达中固有的时间动态方面的有效性。结果表明，在较小的数据集中，较简单的 RNN 架构的表现可能与更复杂的模型相当甚至更优。我们还在较大的数据集上应用了以下实验：一是基于我们原始数据集进行的增强，另一是来自其他来源。这项研究不仅增进了我们对音乐情感影响的理解，还展示了神经网络在创建更个性化和情感共鸣的音乐推荐和治疗系统方面的潜力。

May, 2024

PerformanceNet: 多频段卷积残差网络得分转音频音乐生成

提出了一个深度卷积模型，学习了乐谱和音频之间的符号表示之间的得分与音频之间的映射，通过用户研究发现，该模型在自然度和情感表现方面的平均意见分数高于 WaveNet 模型和两个商业声音库。

Nov, 2018

钢琴音质的全面评价

本研究旨在开发一种综合评估方法来辅助购买决策，评估不同钢琴的固有音质，使用主观问卷调查和卷积神经网络进行优化，结果显示受过音乐训练的人能够更好地区分不同钢琴的音质差异。

Oct, 2023

解释 Siamese 神经网络中的对称性不变量和守恒量

本文在理论物理学领域引入可解释的孪生神经网络 (SNN) 用于相似性检测。具体而言，我们将 SNN 应用于特殊相对论事件、电磁场的变形以及中心势场中粒子的运动，在这些例子中，SNN 学习识别属于同一事件、同一场配置或相同运动轨迹的数据点。结果表明，在学习哪些数据点属于同一事件或场配置的过程中，这些 SNN 还可以学习相关的对称不变量和守恒量。这些 SNN 高度可解释，使我们能够揭示对称不变量和守恒量而无需预先知识。

Mar, 2020

从头开始学习音乐特征

本文介绍了一个新的大规模音乐数据集 MusicNet，旨在为音乐研究的机器学习方法提供监督和评估，该数据集由 10 位作曲家创作的 11 种乐器的数百个自由许可的古典音乐录音以及关于它们的时间标签组成，其中包含的多标签分类任务以及多项基于机器学习结构的性能评估表明了末端到末端的神经网络在音符预测方面的学习效果最佳。

Nov, 2016

针对乐谱图像的分数跟随技术

本文介绍了一种通过神经网络匹配短音频片段与乐谱中对应像素位置的方法。实验结果表明，使用深度学习技术处理音乐乐谱具有可行性且是一个有前途的研究方向。

Dec, 2016

用循环模型进行音频 - 乐谱检索的片段摘要

设计了一种跨模态循环网络，通过学习联合嵌入，能够总结相应音频和乐谱的更长的段落，解决了强对齐数据和音频与乐谱节奏差异导致的局部和全局差异问题，并在实验中验证了该方法在所有可能的配置中进行更准确的检索。

Sep, 2023

通过玩音乐拼图游戏生成音乐混搭

提出一种基于自监督学习的音乐拼图游戏，旨在训练神经网络模型学习音乐中的序列模式，并利用基于时序片段的相似度得分，提出了改进的网络结构来实现元素的排序，该模型表现优于其他相似模型，且在多个游戏难度中均表现出色。

Sep, 2017

Siamese SIREN：使用隐式神经表示的音频压缩

该研究介绍了一种新的基于 SIREN 架构的方法 ——Siamese SIREN。实验结果表明，与其他 INR 架构相比，Siamese SIREN 在利用更少的网络参数的情况下可以实现较高的音频重建保真度。

Jun, 2023

利用 Transformer 网络重建钢琴演奏中的人类表现力

本文提出了一种使用多层双向 Transformer 编码器重建钢琴演奏人类表现力的新方法，并使用现有的转录模型得到的转录乐谱来训练我们的模型，在此基础上通过控制采样过程中的钢琴家身份探索我们系统模拟不同钢琴家表现力差异的能力，在统计生成的表现力强的演奏和听力测试中对该系统进行评估，结果表明我们的方法实现了从转录分数生成类似于人类钢琴演奏的结果的最新技术水平，同时全面且一致地重建了人类的表现力，这进一步提出了挑战。

Jun, 2023