本文介绍了一个名为 JSUT 的日语语音语料库,用于实现端到端语音合成,由机器学习及深度学习等技术所建立。该语料库包含 10 小时的读取样式语音数据及其转录,涵盖了日常使用日语字符的全部主要发音。
Oct, 2017
介绍了日英字幕语料库 (JESC),是最大的免费的日英语料库,其中包含超过 320 万个例子。
Common Voice 是一个为语音技术研究和开发设计的大型多语言转录音频资源,采用众包方式进行数据收集和验证,目前包括 29 种语言,收集了超过 2500 小时的音频数据,实现了多语言端到端的自动语音识别。
Dec, 2019
台湾在 2020 年启动了 VoiceBanking 项目,旨在为肌萎缩性侧索硬化症患者提供个性化的普通话语音合成系统。本文报道了 VoiceBanking 项目中语料库设计、录制、数据整理和修正,以及开发的个性化普通话语音合成系统的评估。
Aug, 2023
该论文提出了一个新的语音语料库 LibriTTS,用于文本转语音,并展示了该语料库训练出的神经完整端到端的 TTS 模型在自然度方面的评估结果不低于 4.0。
Apr, 2019
本文旨在通过引入一个新构建的日英商务会话平行语料库,提高会话文本的机器翻译质量,并分析了该语料库,列举了自动翻译的具有挑战性的实例。同时,本文还试图将语料库添加到机器翻译训练中,并展示了基于该语料库训练的系统的优势。
Aug, 2020
本文介绍了一个新的基于网络的英日平行语料库 JParaCrawl v3.0,其包括超过 2100 万个独特的平行句对,证明它可以提高各种领域机器翻译模型的准确性,并将在将来公开发布。
Feb, 2022
本文介绍了 CoVoST—— 一个多语言的语音 - 文本翻译语料库,并提供了详细的数据集创建方法、数据质量实证和多语言翻译模型的前期实验成果。
Feb, 2020
介绍了一种新的语音语料库 STUDIES,用于开发一种语音代理程序,可以友好地说话,并通过将 “共情对话” 行为纳入口语对话系统来开发可以更自然地响应用户的声音代理程序。通过将交际者的情感标签和会话上下文嵌入到文本到语音合成中,可以产生与使用代理的情感标签合成的语音相同程度的自然度。
Mar, 2022
引入了 IroyinSpeech 语料库 - 这是一个受影响于希望增加高质量、免费、当代的约鲁巴语言音频的愿望的新数据集。我们发布了一个多用途数据集,可用于 TTS 和 ASR 任务,并从新闻和创意写作领域中的文本句子进行筛选,使用开放许可证 CC-BY-4.0,并让 80 名志愿者录制了该数据集的 38.5 小时内容。
Jul, 2023