Sep, 2023
利用开源工具和公开数据复现 Whisper-Style 训练
Reproducing Whisper-Style Training Using an Open-Source Toolkit and Publicly Available Data
Yifan Peng, Jinchuan Tian, Brian Yan, Dan Berrebbi, Xuankai Chang...
TL;DR使用开源工具包与公开可用的数据,本文提出了一种 Open Whisper-style Speech Model (OWSM) 来训练语音模型,以解决以前无法公开访问的全流程模型开发所面临的性能提升、效率、鲁棒性、公正性和偏见等问题,并公开发布所有脚本、预训练模型和训练日志,以促进开放科学。