BriefGPT.xyz
大模型
Ask
alpha
关键词
encodec
搜索结果 - 3
EnCLAP:基于神经音频编解码器和音频文本联合嵌入的自动音频字幕生成
我们提出了一种自动音频字幕的新框架 EnCLAP,使用了两个声学表示模型 EnCodec 和 CLAP 以及一个预训练语言模型 BART。我们还引入了一种称为 masked codec modeling 的新训练目标,提高了预训练语言模型的
→
PDF
5 months ago
EnCodecMAE: 利用神经编解码器进行通用音频表示学习
本研究探讨了使用神经音频编解码器 EnCodec 生成发音、音乐和环境声音的离散目标,以学习基于遮蔽自动编码器的通用音频模型 EncodecMAE,并在广泛的音频任务中取得了与领先的音频表示模型相媲美或更好的性能。
PDF
10 months ago
FunCodec: 一个基础、可重现和可集成的神经语音编解码开源工具包
FunCodec 是一个基于开源语音处理工具 FunASR 的基础神经语音编解码器工具包,提供训练可重现、推理脚本用于最新的神经语音编解码器模型,如 SoundStream 和 Encodec,并且可以轻松集成到下游任务中,如语音识别。其中
→
PDF
10 months ago
Prev
Next