May, 2025

潮州-野生:首个带有拼音标注的潮州方言语料库

TL;DR本研究解决了缺乏潮州方言语料的数据问题,构建了一个包含18.9小时多扬声器潮州方言的语音语料库,并提供精准的拼音和正字法标注。研究表明,该语料库在自动语音识别与语音合成任务中具有良好的实用性,推动了该低资源语言的研究与应用。