Serenade：一种人 - 机交互自动和弦估计模型

MMOct, 2023

Serenade：一种人 - 机交互自动和弦估计模型

Serenade: A Model for Human-in-the-loop Automatic Chord Estimation

Hendrik Vincent Koops, Gianluca Micchi, Ilaria Manco, Elio Quinton

TL;DR通过人工和自回归模型共同创建音频音轨的和声标注，我们提出了一种新颖的替代方法，在自动产生和声预测后，人工稀疏地注释低模型置信度的部分，然后模型根据人工指导调整其预测，我们在一组流行音乐数据集上评估了我们的模型并展示了这种人工参与的提升效果。

Abstract

computational harmony analysis is important for mir tasks such as automatic segmentation, corpus analysis and automatic chord label estimation

computational harmony analysis mir tasks inter-rater agreement automatic chord label estimation human-in-the-loop approach

发现论文，激发创造

基于神经 HSMM 的无监督谐波分析学习与代码质量模板

基于隐性半马尔可夫模型（HSMM），本文提出了一种无监督学习的谐波分析方法。我们引入了和弦质量模板，其指定了给定根音和和弦质量的音高级别的概率。除此之外，构成 HSMM 的其他概率分布通过无监督学习自动学习，这在现有研究中是一个挑战。通过使用现有的标记数据评估了所提出模型的谐波分析结果。虽然我们提出的方法还没有像使用监督学习和复杂规则设计的现有模型那样表现出色，但它具有不需要昂贵标记数据或规则详细说明的优势。此外，我们还展示了基于马尔可夫模型的状态转移概率如何实现无先验知识下的基音识别。

Mar, 2024

基于和谐感知学习的结构增强流行音乐生成

本文提出了一种基于和声学习的结构增强流行音乐生成方法，并设计了和声感知的分层音乐变形器 (HAT)，可以在多层级音乐元素中自适应地利用结构，从而提高生成的流行音乐的质量。实验结果表明，与现有方法相比，HAT 可以更好地理解结构，尤其是在形式和质地方面可以提高生成音乐的质量。

Sep, 2021

无监督的旋律引导歌词生成

本文提出了一种基于分层框架和旋律 - 歌词对齐的歌词生成模型，能够在没有旋律 - 歌词对齐数据的情况下，通过对内容进行控制生成更可唱、更易懂、更连贯和有韵律的高质量歌词。

May, 2023

预测编码模型中的音乐感知与预测关系

通过基于预测编码的神经网络模型研究人类音乐感知，模型经过大量 Classic 音乐和流行旋律训练后，发现预测误差依赖于音符，音高间隔和时间上下文等信息，提示可用预测编码神经网络来表征影响音乐感知的特征和主题。

Oct, 2022

基于生成式预训练的旋律转录

利用 Jukebox 描述音频数据，并结合新数据集进行模型训练，在旋律转录方面取得了令人瞩目的进展，从而实现了直接从音频转录可阅读的乐谱的 Sheet Sage 系统。

Dec, 2022

带有可控和声的按和弦演奏的旋律和声化

本文提出了 DeepChoir 这样一个旨在生成和声的音乐系统，通过特定的和弦进程生成给定旋律的四声部赞美诗曲子，实验结果表明该系统的音乐表示和深度学习方法的有效性以及生成赞美诗的可控性。

Feb, 2022

基于条件自回归建模的谐波重构

本研究基于 van den Oord et al. (2017) 的方法，演示了一种用于高效音乐再创作的条件自回归流程，该过程以和弦序列注释为条件生成多样且有结构的乐曲。

Nov, 2018

从歌词中生成神经元旋律

本文提出了一种基于序列到序列框架，利用神经编码器和分层解码器，结合自然语言和旋律创作音乐曲调及准确标定的模型，并在 18,451 首流行歌曲中的歌词 - 旋律匹配对上进行了实验，论文通过人工评估证明了模型生成的旋律比基线模型更优秀。

Sep, 2018

无监督旋律 - 歌词生成

本研究提出一种层次化歌词生成框架，通过将已知旋律编码为解码约束并获得歌曲大纲和完整歌词的生成，实现未经过任何对齐的歌曲和歌词数据即可生成高质量歌词，并通过歌曲大纲实现内容控制。实验结果表明，本模型相对于 SongMASS 等强基线模型，基于人类评分获得了 24% 的整体质量改善。

May, 2023

谐波机器学习模型的鲁棒性

用 Harmonic Robustness 方法测试机器学习模型的鲁棒性，无论是在训练过程中还是在黑盒实时推断监控中，该方法基于与谐波均值属性的功能偏差，表明其不稳定性和缺乏可解释性。通过在低维树和前馈神经网络中进行实现示例，该方法可可靠地识别过拟合，并且在更复杂的高维模型（如 ResNet-50 和 Vision Transformer）中，它能够高效地测量图像类别间的对抗性脆弱性。

Apr, 2024