audio tasks | BriefGPT - AI 论文速递

关键词audio tasks

搜索结果 - 5

LauraGPT: 听、关注、理解与重建音频的 GPT
本文提出了 LauraGPT，一个统一的 GPT 模型，用于音频识别、理解和生成，实现了在多个音频处理基准测试上与现有 SOTA 模型相媲美或卓越的性能。
PDF9 months ago
EnCodecMAE: 利用神经编解码器进行通用音频表示学习
本研究探讨了使用神经音频编解码器 EnCodec 生成发音、音乐和环境声音的离散目标，以学习基于遮蔽自动编码器的通用音频模型 EncodecMAE，并在广泛的音频任务中取得了与领先的音频表示模型相媲美或更好的性能。
PDF10 months ago
GAFX: 一般音频特征提取器
本研究比较了基于深度学习的特征提取方法和基于频谱图的现有方法，提出了一种通用音频特征提取器 (GAFX)，并通过 GTZAN 数据集上的音乐分类任务进行了实验，并基于多个模型对该框架进行了详细的去枝剪枝研究。
PDF2 years ago
自适应集成学习用于语音和音频分类
本研究提出了一种自适应学习集成算法，通过自学习，将多个机器学习模型相互学习并结合起来，实验结果表明该算法在三个音频任务中相比基准集成模型有显著的性能提升，说明了模型之间互相学习的有效性。
PDF3 years ago
适应性梯度用于对抗性扰动生成
深度神经网络在计算机视觉、自然语言处理和音频任务中取得了显着的成功。
PDF5 years ago