利用自相似性作为注意力机制生成具有结构的音乐

Jun, 2024

利用自相似性作为注意力机制生成具有结构的音乐

Generating Music with Structure Using Self-Similarity as Attention

Sophia Hager, Kathleen Hablutzel, Katherine Kinnaird

TL;DR我们提出了一种注意力层的方法，使用用户提供的自相似矩阵来在生成音乐时添加模板结构，并通过与没有注意力机制的模型进行比较，证明了该方法显著提高了网络的特定结构复制能力，以及在未见测试集上的性能。

Abstract

Despite the innovations in deep learning and generative ai, creating long term structure as well as the layers of repeated structure common in musical works remains an open challenge in →

deep learning generative ai music generation attention layer sing system

发现论文，激发创造

使用自我关注实现可解释的音乐标记

提出了一种基于自注意力机制的深度序列模型，用于解决音乐信息检索问题，并且相比于传统的卷积和递归神经网络方法，该模型更具可解释性且具有竞争力的结果。

Jun, 2019

音乐变形器

提出了一种使用修改后的相对注意力机制来设计变形金刚神经网络的算法，用于音乐作曲、演奏和生成任务，并在 JSB Chorales 和 Piano-e-Competition 数据集上获得了最先进的结果。

Sep, 2018

基于自相似性和新颖性损失的音乐结构分析

音乐结构分析的有监督方法，通过同时学习特征和卷积内核来进行音乐边界检测，并演示了相对特征学习和自注意力在该任务中的作用。

Sep, 2023

自注意力声学模型

本篇论文探讨如何应用自注意力机制解决计算复杂度、模型稳定性和位置信息等问题，相比于 LSTM 模型，该模型不仅运算时间更快，而且更具可解释性。

Mar, 2018

SING：符号到乐器神经生成器

本研究提出了一种基于深度学习的轻量级神经音频合成器 SING，其可以通过单一解码器从近 1000 种乐器中生成音符，并且通过新的损失函数将生成的和目标波形的对数谱距离最小化，提高了音质的感知品质。与基于 WaveNet 的最新自动编码器相比，在训练和推理方面分别快 32 倍和快 2500 倍。

Oct, 2018

利用自注意力机制来加强负向信号在序列音乐推荐中的作用

使用基于 transformer 的自注意力架构来学习顺序音乐推荐中的隐式会话级信息，同时提出一项对比学习任务来纳入负面反馈，以促进正面命中和惩罚负面命中，并通过实验证明这种方法相比忽略负面用户反馈的基准架构具有一致的性能提升。

Sep, 2023

使用前馈 Transformer 进行序列到序列歌唱合成

提出了一种基于 Transformer 模型的序列到序列歌曲合成器，使用自身注意力机制结合初始的音长模型来准确合成出作曲家想要的声音，相比于基于老师强制训练的自回归模型，具有更快的推理速度和更好的生成效果。

Oct, 2019

互动背景下的音乐生成调查

近年来，机器学习，特别是生成对抗神经网络（GANs）和基于注意力的神经网络（transformers），已成功用于作曲和生成音乐，包括旋律和多声部作品。然而，现有研究主要集中在风格复制和转换的问题上，并未涉及到人机共同创作和评估。本文综述了音乐表征、特征分析、启发式算法、统计和参数建模，人类和自动化评估措施，并讨论了哪种方法和模型最适合于实时互动。

Feb, 2024

学习视觉注意力生成模型

通过利用关注机制的生成学习框架，可以将图像中感兴趣的区域传递给生成建模的标准表征，并集中精力在感兴趣的对象上，从而建立新面孔的生成模型。

Dec, 2013

基于自注意力和增强记忆的流式 Transformer 声学模型

本文提出了一种新颖的增强记忆自注意力机制，用于 Transformer 语音识别中的流式应用，相对于现有的可流式 Transformer 方法，减小了计算量并在 Librispeech 基准测试中实现了超过 15% 的相对误差降低。

May, 2020