ICMLAug, 2023

Speech Wikimedia:一个包含 77 种语言的多语言语音数据集

TL;DR维基媒体数据集是一个公开可用的音频和转录汇编,包含来自维基共享资源的 1780 小时(195GB)CC-BY-SA 许可的转录语音,在 77 种不同语言中包含了多种场景和讲话者。每个音频文件都有一个或多个不同语言的转录,使得此数据集适用于训练语音识别、语音翻译和机器翻译模型。