JVS 语料库：免费的日本多说话人语音语料库

Aug, 2019

JVS 语料库：免费的日本多说话人语音语料库

JVS corpus: free Japanese multi-speaker voice corpus

Shinnosuke Takamichi, Kentaro Mitsui, Yuki Saito, Tomoki Koriyama, Naoko Tanji...

TL;DR本文介绍了日语语音库 JVS 的构建过程和规格，并概述了其在话音合成、语音转换和多人训练等方面的研究应用。

Abstract

Thanks to improvements in machine learning techniques, including deep learning, speech synthesis is becoming a machine learning task. To a

speech synthesis machine learning japanese voice corpora text-to-speech synthesis multi-speaker modeling

发现论文，激发创造

JSUT 语料库：面向端到端语音合成的免费大规模日语语音语料库

本文介绍了一个名为 JSUT 的日语语音语料库，用于实现端到端语音合成，由机器学习及深度学习等技术所建立。该语料库包含 10 小时的读取样式语音数据及其转录，涵盖了日常使用日语字符的全部主要发音。

Oct, 2017

日英字幕语料库

介绍了日英字幕语料库 (JESC)，是最大的免费的日英语料库，其中包含超过 320 万个例子。

Oct, 2017

Common Voice: 一個大規模多語言語音語料庫

Common Voice 是一个为语音技术研究和开发设计的大型多语言转录音频资源，采用众包方式进行数据收集和验证，目前包括 29 种语言，收集了超过 2500 小时的音频数据，实现了多语言端到端的自动语音识别。

Dec, 2019

VoiceBank-2023：用于构建语音障碍患者个性化 TTS 系统的多说话人普通话语音语料库

台湾在 2020 年启动了 VoiceBanking 项目，旨在为肌萎缩性侧索硬化症患者提供个性化的普通话语音合成系统。本文报道了 VoiceBanking 项目中语料库设计、录制、数据整理和修正，以及开发的个性化普通话语音合成系统的评估。

Aug, 2023

LibriTTS：从 LibriSpeech 中衍生的用于文本转语音的语料库

该论文提出了一个新的语音语料库 LibriTTS，用于文本转语音，并展示了该语料库训练出的神经完整端到端的 TTS 模型在自然度方面的评估结果不低于 4.0。

Apr, 2019

商务对话语料库设计

本文旨在通过引入一个新构建的日英商务会话平行语料库，提高会话文本的机器翻译质量，并分析了该语料库，列举了自动翻译的具有挑战性的实例。同时，本文还试图将语料库添加到机器翻译训练中，并展示了基于该语料库训练的系统的优势。

Aug, 2020

JParaCrawl v3.0：大规模英日平行语料库

本文介绍了一个新的基于网络的英日平行语料库 JParaCrawl v3.0，其包括超过 2100 万个独特的平行句对，证明它可以提高各种领域机器翻译模型的准确性，并将在将来公开发布。

Feb, 2022

CoVoST: 一个多样化的多语种语音到文本翻译语料库

本文介绍了 CoVoST—— 一个多语言的语音 - 文本翻译语料库，并提供了详细的数据集创建方法、数据质量实证和多语言翻译模型的前期实验成果。

Feb, 2020

面向友好语音代理的日语共情对话语料库研究

介绍了一种新的语音语料库 STUDIES，用于开发一种语音代理程序，可以友好地说话，并通过将 “共情对话” 行为纳入口语对话系统来开发可以更自然地响应用户的声音代理程序。通过将交际者的情感标签和会话上下文嵌入到文本到语音合成中，可以产生与使用代理的情感标签合成的语音相同程度的自然度。

Mar, 2022

ÌròyìnSpeech：一个多功能的约鲁巴语语音语料库

引入了 IroyinSpeech 语料库 - 这是一个受影响于希望增加高质量、免费、当代的约鲁巴语言音频的愿望的新数据集。我们发布了一个多用途数据集，可用于 TTS 和 ASR 任务，并从新闻和创意写作领域中的文本句子进行筛选，使用开放许可证 CC-BY-4.0，并让 80 名志愿者录制了该数据集的 38.5 小时内容。

Jul, 2023