Mar, 2022

开源MagicData-RAMC:一份丰富标注的普通话对话(RAMC)语音数据集

TL;DR该研究介绍了一个高质量的、富有注释的汉语普通话会话数据集(MagicData-RAMC),包含180小时的汉语普通话对话录音数据,分为15个领域并带有主题标签,旨在丰富汉语言语社区的数据多样性,为自动语音识别、话者分离、主题检测、关键词检索、语音合成等一系列与语音相关的任务提供支持。