关键词discrete speech tokens
搜索结果 - 2
- 儿童语音识别的离散标记增强
在这项研究中,我们调查了将离散语音标记整合到儿童语音识别系统中的方法,以解决数据稀缺和隐私问题,并探索了单视图和多视图策略,测试了模型的泛化能力。结果表明,儿童的离散标记语音识别系统几乎可以达到与传统方法相当的性能,并且参数减少了约 83% - Interspeech 2024 离散语音单元挑战中的语音处理技术报告
本文介绍了上海交通大学 X-LANCE 小组在 Interspeech 2024 离散语音单元挑战赛的 TTS(声学 + vocoder)、SVS 和 ASR 任务中开发的系统,尤其是在 TTS 任务中,无论是使用整个训练集还是仅 1 小时