使用端到端深度神经网络建模非线性音频效果

Oct, 2018

使用端到端深度神经网络建模非线性音频效果

Modeling of nonlinear audio effects with end-to-end deep neural networks

Marco A. Martínez Ramirez, Joshua D. Reiss

TL;DR本文使用深度学习架构，旨在找到通用的端到端深度神经网络来对非线性音频效果进行建模，进而探讨不同乐器之间的泛化能力。

Abstract

In the context of music production, distortion effects are mainly used for aesthetic reasons and are usually applied to electric musical instruments. Most existing methods for →

distortion effects music production nonlinear modeling deep learning architectures audio processing

发现论文，激发创造

用时间变化的特征调制建模黑盒音频效果

该研究提出了一种将时间变化的特征线性调制整合进现有的时间卷积背骨架中的方法，以更准确地捕获长时间尺度上的音频效应，从而增强深度学习方法对音频效应的建模能力。

Nov, 2022

虚拟模拟音频效果建模的循环神经网络比较研究

通过比较 State Space 模型、Linear Recurrent Units 和 Long Short Term Memory 网络在模拟音频效果方面的性能，本文研究了近期机器学习进展在虚拟类比建模中的应用，包括信号历史编码、能量包络、频率内容和瞬态等方面的准确度。结果表明，Long Short Term Memory 网络在模拟失真和均衡器方面的准确度较高，而 State Space 模型在饱和和压缩方面的模拟能力超过其他方法。对于长时间变化特性，State Space 模型展现了最高的准确度。Long Short Term Memory 网络和 Linear Recurrent Unit 网络则更容易引入音频伪像。

May, 2024

音乐的深度学习

本研究尝试使用深度神经网络建立生成模型，以生成既有和声和旋律，并且足以通过人类作曲的音乐，并利用端到端学习和生成的方法。

Jun, 2016

非可微音频效果的样式转移

我们提出了一种深度学习方法用于音频制作风格匹配，可以与大多数常用框架中实现的效果一起使用，只要考虑的参数在连续范围内，能够通过逻辑编码音色信息来进行风格匹配。

Sep, 2023

使用可微的混音控制台进行多音轨自动混音的神经音效

本文针对深度学习在多轨混音中的应用进行了研究和探索，提出了一种基于领域的模型，使用预训练的子网络和权重共享，并采用求和 / 差分立体声损失函数进行训练，得到的可用于人工调整或完善的混音参数表现出优异的表现。这是第一篇在波形级别上从实际数据中学习多轨混音约定的方法的研究。

Oct, 2020

音频修复的扩散模型

基于扩散模型的音频修复算法在语音增强和音乐修复任务中表现出色，既具有可解释性又具有出色的音质性能。

Feb, 2024

深度学习音频生成方法概述

本文综述了音频生成中深度学习模型开发所使用的典型技术，包括音频表示、深度学习架构变体及其实际应用，以及常用的评估指标。该文章旨在为音频生成领域的初学者和新手提供对当前最先进的音频生成方法及相关研究的全面理解，以供未来研究探索。

May, 2024

音频信号处理的深度学习

该研究文章综述了当前音频信号处理领域中基于深度学习的技术，着重介绍了其在语音、音乐、环境声音处理中的相同点和差异，强调了其潜在的交叉互补性。文章介绍了主要的特征表示和深度学习模型，以及其在音频识别和合成分离领域的应用，并最终确定了深度学习在音频信号处理中的关键问题和未来研究方向。

Apr, 2019

磁带录音机的神经建模

本研究提出了一种使用神经网络数字仿真磁带录音机声音特性的方法，通过三个部分组成的信号链构成：磁记录过程产生的滞后非线性和滤波器、磁记录和播放放大器的联合产生的滞后非线性和滤波器、带状态的时延和各种电磁成分的复合添加噪声，研究结果可以用于构建用于音乐制作和音频仿古任务的虚拟磁带录音设备。

May, 2023

从人工神经网络到深度学习在音乐生成中的历史、概念和趋势

本文介绍了基于深度学习技术的音乐生成方法，包括早期使用人工神经网络的作品和最近的系统，使用现代深度学习技术和控制手段生成具有不同音乐风格的音乐。

Apr, 2020