使用端到端深度神经网络建模非线性音频效果
该研究提出了一种将时间变化的特征线性调制整合进现有的时间卷积背骨架中的方法,以更准确地捕获长时间尺度上的音频效应,从而增强深度学习方法对音频效应的建模能力。
Nov, 2022
通过比较 State Space 模型、Linear Recurrent Units 和 Long Short Term Memory 网络在模拟音频效果方面的性能,本文研究了近期机器学习进展在虚拟类比建模中的应用,包括信号历史编码、能量包络、频率内容和瞬态等方面的准确度。结果表明,Long Short Term Memory 网络在模拟失真和均衡器方面的准确度较高,而 State Space 模型在饱和和压缩方面的模拟能力超过其他方法。对于长时间变化特性,State Space 模型展现了最高的准确度。Long Short Term Memory 网络和 Linear Recurrent Unit 网络则更容易引入音频伪像。
May, 2024
我们提出了一种深度学习方法用于音频制作风格匹配,可以与大多数常用框架中实现的效果一起使用,只要考虑的参数在连续范围内,能够通过逻辑编码音色信息来进行风格匹配。
Sep, 2023
本文针对深度学习在多轨混音中的应用进行了研究和探索,提出了一种基于领域的模型,使用预训练的子网络和权重共享,并采用求和 / 差分立体声损失函数进行训练,得到的可用于人工调整或完善的混音参数表现出优异的表现。这是第一篇在波形级别上从实际数据中学习多轨混音约定的方法的研究。
Oct, 2020
本文综述了音频生成中深度学习模型开发所使用的典型技术,包括音频表示、深度学习架构变体及其实际应用,以及常用的评估指标。该文章旨在为音频生成领域的初学者和新手提供对当前最先进的音频生成方法及相关研究的全面理解,以供未来研究探索。
May, 2024
该研究文章综述了当前音频信号处理领域中基于深度学习的技术,着重介绍了其在语音、音乐、环境声音处理中的相同点和差异,强调了其潜在的交叉互补性。文章介绍了主要的特征表示和深度学习模型,以及其在音频识别和合成分离领域的应用,并最终确定了深度学习在音频信号处理中的关键问题和未来研究方向。
Apr, 2019
本研究提出了一种使用神经网络数字仿真磁带录音机声音特性的方法,通过三个部分组成的信号链构成:磁记录过程产生的滞后非线性和滤波器、磁记录和播放放大器的联合产生的滞后非线性和滤波器、带状态的时延和各种电磁成分的复合添加噪声,研究结果可以用于构建用于音乐制作和音频仿古任务的虚拟磁带录音设备。
May, 2023
本文介绍了基于深度学习技术的音乐生成方法,包括早期使用人工神经网络的作品和最近的系统,使用现代深度学习技术和控制手段生成具有不同音乐风格的音乐。
Apr, 2020