BriefGPT.xyz
大模型
Ask
alpha
关键词
retrieval-based voice conversion
搜索结果 - 2
使用经过微调的 XLSR Wav2Vec2 在自定义数据集和 mBART 上对视频进行转录和翻译
通过最小的数据量,利用检索式语音转换和自监督表示的方法,对个性化语音识别模型进行训练,实现多语言视频内容转录和翻译的无障碍解决方案。
PDF
4 months ago
自定义数据增强用于低资源 ASR 的 Bark 和基于检索的语音转换
本文提出了两种创新方法,用于为印地语等低资源语言构建定制的 Common Voice 数据集。第一种方法利用 Suno 开发的基于 Transformer 的文本到音频模型 Bark,结合 Meta 的 enCodec 和预训练的 HuBe
→
PDF
7 months ago
Prev
Next