BriefGPT.xyz
大模型
Ask
alpha
关键词
speech conversion
搜索结果 - 3
使用 Bark、mBART 和经过微调的 XLSR Wav2Vec2 进行端到端印地语到英语语音转换
该研究论文介绍了一种针对印度 - 英语翻译的端到端语音转换框架,通过集成最新的技术实现自动语音识别、神经机器翻译和文本转语音合成组件,提供了一种统一无缝的跨语言交流方法。
PDF
6 months ago
ICLR
基于样本自编码器的无监督音频视觉合成
该论文提出了一种无监督方法,可以将任何个人的输入语音转换为无限数量的输出扬声器的音频可视化流,并使用先例自编码器学习特定目标样本语音的声音、风格韵律和视觉外观,它可以很容易地扩展到任意数量的扬声器和风格,而无需对输入扬声器进行任何训练数据。
PDF
4 years ago
非平行情感语音转换
本文提出了一种非并行数据驱动的情感语音转换方法,通过学习两个分布之间的翻译模型而实现非并行训练,该方法在音频内容编码与情感编码空间中进行情感转换,实现了保留说话人身份和语言特征的情感相关特征转移。
PDF
6 years ago
Prev
Next