Sep, 2023

利用开源工具和公开数据复现 Whisper-Style 训练

TL;DR使用开源工具包与公开可用的数据,本文提出了一种 Open Whisper-style Speech Model (OWSM) 来训练语音模型,以解决以前无法公开访问的全流程模型开发所面临的性能提升、效率、鲁棒性、公正性和偏见等问题,并公开发布所有脚本、预训练模型和训练日志,以促进开放科学。