BriefGPT.xyz
Ask
alpha
关键词
enclap
搜索结果 - 1
EnCLAP:基于神经音频编解码器和音频文本联合嵌入的自动音频字幕生成
我们提出了一种自动音频字幕的新框架 EnCLAP,使用了两个声学表示模型 EnCodec 和 CLAP 以及一个预训练语言模型 BART。我们还引入了一种称为 masked codec modeling 的新训练目标,提高了预训练语言模型的
→
PDF
5 months ago
Prev
Next