audio data augmentation | BriefGPT

关键词audio data augmentation

搜索结果 - 5

基于数据驱动的鲁棒自动钢琴转录分析
通过研究训练数据的角度，本文通过在 MAESTRO 数据集的原始和重新执行版本上使用各种数据增强技术，获得了 MAPS 数据集的最新音符起始准确性，而无需查看其他的训练数据。
PDF5 months ago
AudRandAug: 音频分类的随机图像增强
通过使用 RandAug 的音频版本 AudRandAug 来进行音频数据增强，本研究表明 AudRandAug 在准确性能方面优于其他现有的数据增强方法。
PDF10 months ago
领域多样化和泛化的跨语料库口语语言识别
研究低资源口语识别 (LID) 问题中跨领域泛化问题，提出领域多样性增强方法 (domain diversification)，并将其作为伪领域考虑，为此研究了领域不变和领域感知方法以及相关增强因子配置，提高了识别准确性。
PDFa year ago
一个真实房间冲激响应数据集的构建和评估
该论文提出了一个真实空间脉冲响应、背景噪声和重传音频数据的数据集，并在两组自动语音识别实验中验证了其应用价值，结果表明精心挑选的有限数量的真实空间脉冲响应与大量人工生成的响应相比，能够取得同等优秀的 ASR 结果；同时，该论文介绍了脉冲响应
PDF6 years ago
深度卷积神经网络与数据增强在环境音分类中的应用
本文提出了一种使用深度卷积神经网络和音频数据增强相结合的方法来进行环境声音分类，通过对增强技术的探索发现在不同类别下所使用的增强技术会对分类准确率产生影响。实验结果表明，该方法在环境声音分类上表现出了最先进的效果。
PDF8 years ago